先决条件:K均值聚类中K的最优值 K均值是最流行的聚类算法之一, 主要是因为其良好的时间性能。随着所分析的数据集大小的增加, K均值的计算时间增加了, 因为它需要在主存储器中存储整个数据集。由于这个原...
ML算法:基于动量的梯度优化器介绍
梯度下降 是机器学习框架中用于训练不同模型的一种优化技术。训练过程由目标函数(或误差函数)组成, 该函数确定机器学习模型在给定数据集上的误差。 在训练时, 该算法的参数被初始化为随机值。随着算法的迭代...
ML算法:使用Python进行多元线性回归
线性回归: 它是预测分析的基本类型和常用类型。这是一种统计方法, 用于对因变量和给定的一组自变量之间的关系进行建模。 有两种类型: 简单线性回归 多元线性回归 让我们讨论使用Python进行多元线性回...
ML算法:Python中数据集的一种热编码
有时在数据集中, 我们会遇到包含没有特定优先顺序的数字的列。列中的数据通常表示类别或类别的值, 并且在列中的数据经过标签编码时也是如此。这会混淆机器学习模型, 为避免这种情况, 列中的数据应进行一次热...
ML算法:OPTICS聚类说明详细指南
先决条件: DBSCAN集群 OPTICS Clustering代表确定集群结构的订购点。它从DBSCAN聚类算法中获得启发。它为DBSCAN群集的概念增加了两个术语。他们是:- 核心距离:这是将给定...
ML算法:使用Sklearn实现OPTICS聚类
先决条件:OPTICS群集 本文将演示如何在Python中使用Sklearn实现OPTICS聚类技术。用于演示的数据集是商城客户细分数据可以从以下位置下载卡格勒. 步骤1:导入所需的库 import ...
ML算法:主成分分析(PCA)详细指南
主成分分析(PCA)是一种使用正交变换的统计过程, 该正交变换将一组相关变量转换为一组不相关变量。 PCA是探索性数据分析和预测模型的机器学习中使用最广泛的工具。此外, PCA是一种无监督的统计技术,...
ML强化学习算法:使用Q学习的Python实现
先决条件:Q学习技术. 强化学习是一种机器学习示例, 其中的学习算法不是基于预设数据而是基于反馈系统来训练的。这些算法被吹捧为机器学习的未来, 因为它们消除了收集和清理数据的成本。 在本文中, 我们将...
ML算法:随机梯度下降(SGD)介绍
什么是梯度下降? 在解释随机梯度下降(SGD)之前, 让我们首先描述什么是梯度下降。梯度下降是机器学习和深度学习中一种流行的优化技术, 它可以与大多数(如果不是全部)学习算法一起使用。梯度是函数的斜率...
ML:T分布随机邻居嵌入(t-SNE)算法
T分布随机邻居嵌入(t-SNE)是一种非线性降维技术, 非常适合在二维或三维的低维空间中嵌入高维数据以进行可视化。 什么是降维? 降维是一种表示2维或3维n维数据(具有许多特征的多维数据)的技术。 降...