机器学习 - 第4页

ML使用SVM对非线性数据集执行分类

先决条件：支持向量机超平面和SVM分类器的定义：对于具有n个特征的线性可分离数据集(因此需要n个维表示), 超平面基本上是一个(n – 1)维子空间, 用于将数据集分为两组, 每个组包含属于不同...

05月04日 1,150 次浏览发表评论

投票分类器是一种机器学习模型, 它在众多模型的整体上进行训练, 并根据其将选定类别作为输出的最高概率来预测输出(类别)。它只是汇总传递给"投票分类器"的每个分类器的结果, 并根据最高的投票预测输出类...

05月04日 IT技术 1,230 次浏览发表评论

使用线性回归, 所有> = 0.5的预测都可以被视为1, 而其余所有<0.5的预测都可以被视为0。但是随后出现了一个问题, 为什么不能使用它进行分类？问题– 假设我们将邮件分类为垃圾邮件...

05月04日 994 次浏览发表评论

在数据挖掘和统计中, 层次聚类分析是一种聚类分析的方法, 其试图建立聚类的层次, 即基于层次的树型结构。基本上, 有两种类型的层次聚类分析策略– 聚集聚类：也称为自下而上的方法或分层的聚集聚类(H...

05月02日 1,507 次浏览发表评论

本文概述 SMOTE(少数民族综合采样技术)–过度采样 NearMiss算法–欠采样在机器学习和数据科学中, 我们经常遇到一个叫做数据分配不平衡, 通常发生在其中一类的观测值比其他类高或低得多的情况...

05月02日 2,486 次浏览发表评论

先决条件：机器学习中的聚类什么是聚类？聚类是一种无监督的机器学习技术, 可根据给定数据彼此之间的距离(相似性)将其分为不同的簇。无监督k均值聚类算法将位于某个特定聚类中的任何点的值设置为0或1...

05月02日 1,195 次浏览发表评论

特征缩放是一种在固定范围内标准化数据中存在的独立特征的技术。它是在数据预处理期间执行的, 以处理高度变化的幅度或值或单位。如果未进行特征缩放, 则机器学习算法将权衡更大的值, 更大的值, 并将较小的值...

05月02日 1,031 次浏览发表评论

特征缩放是一种在固定范围内标准化数据中存在的独立特征的技术。它是在数据预处理期间执行的。加工：给定具有以下特征的数据集-年龄, 工资, BHK公寓, 其数据大小为5000人, 每个人具有这些独立的...

05月02日 1,123 次浏览发表评论

先决条件：决策树分类器极随机树分类器(额外树分类器)是一种整体学习技术, 可将在"森林"中收集的多个不相关的决策树的结果进行汇总, 以输出其分类结果。从概念上讲, 它与随机森林分类器非常相似, 唯...

05月02日 1,693 次浏览发表评论

面临的挑战是识别欺诈性的信用卡交易, 以便不向信用卡公司的客户收取未购买商品的费用。信用卡欺诈检测所涉及的主要挑战是：每天都会处理大量数据, 并且模型构建必须足够快才能及时响应骗局。数据不平衡,...

05月02日 1,120 次浏览发表评论