lsbin - 聚焦IT前沿技术、分享开发经验和数码行业资讯

MongoDB Python插入和更新数据

先决条件：MongoDB Python基础我们首先将了解如何在数据库集合中插入文档/条目。然后, 我们将研究如何使用python中的pymongo库更新MongoDB中的现有文档。更新命令可帮助我们...

05月02日 Python 1,666 次浏览发表评论

在数据挖掘和统计中, 层次聚类分析是一种聚类分析的方法, 其试图建立聚类的层次, 即基于层次的树型结构。基本上, 有两种类型的层次聚类分析策略– 聚集聚类：也称为自下而上的方法或分层的聚集聚类(H...

05月02日 1,430 次浏览发表评论

本文概述 SMOTE(少数民族综合采样技术)–过度采样 NearMiss算法–欠采样在机器学习和数据科学中, 我们经常遇到一个叫做数据分配不平衡, 通常发生在其中一类的观测值比其他类高或低得多的情况...

05月02日 2,370 次浏览发表评论

先决条件：机器学习中的聚类什么是聚类？聚类是一种无监督的机器学习技术, 可根据给定数据彼此之间的距离(相似性)将其分为不同的簇。无监督k均值聚类算法将位于某个特定聚类中的任何点的值设置为0或1...

05月02日 1,073 次浏览发表评论

特征缩放是一种在固定范围内标准化数据中存在的独立特征的技术。它是在数据预处理期间执行的, 以处理高度变化的幅度或值或单位。如果未进行特征缩放, 则机器学习算法将权衡更大的值, 更大的值, 并将较小的值...

05月02日 957 次浏览发表评论

特征缩放是一种在固定范围内标准化数据中存在的独立特征的技术。它是在数据预处理期间执行的。加工：给定具有以下特征的数据集-年龄, 工资, BHK公寓, 其数据大小为5000人, 每个人具有这些独立的...

05月02日 1,055 次浏览发表评论

先决条件：决策树分类器极随机树分类器(额外树分类器)是一种整体学习技术, 可将在"森林"中收集的多个不相关的决策树的结果进行汇总, 以输出其分类结果。从概念上讲, 它与随机森林分类器非常相似, 唯...

05月02日 1,605 次浏览发表评论

面临的挑战是识别欺诈性的信用卡交易, 以便不向信用卡公司的客户收取未购买商品的费用。信用卡欺诈检测所涉及的主要挑战是：每天都会处理大量数据, 并且模型构建必须足够快才能及时响应骗局。数据不平衡,...

05月02日 1,059 次浏览发表评论

对于线性回归, 成本函数为– 但是对于Logistic回归, 这将导致非凸成本函数。但这会导致成本函数具有局部最优值, 这对于梯度下降计算全局最优值来说是一个很大的问题。因此, 对于Logistic...

05月02日 1,256 次浏览发表评论

先决条件：分类和回归分类和回归是两个主要的预测问题, 通常会与数据挖掘和机器学习一起处理。分类是查找或发现模型或函数的过程, 该过程有助于将数据分为多个类别, 即离散值。在分类中, 根据输入中提供...

05月02日 1,026 次浏览发表评论