本文将演示如何构建一个文字产生器通过建立一个门控循环单元网络。训练网络的概念性过程是首先向网络提供网络上正在训练的文本中存在的每个字符到唯一编号的映射。然后将每个字符热编码为向量, 这是网络所需的格式...
Python MongoDB数据库开发详细解读
先决条件:MongoDB:简介 MongoDB是一个跨平台的, 面向文档的数据库, 可处理集合和文档的概念。 MongoDB提供高速, 高可用性和高可伸缩性。 在人们心中出现的下一个问题是"为什么要使...
MongoDB Python插入和更新数据
先决条件:MongoDB Python基础 我们首先将了解如何在数据库集合中插入文档/条目。然后, 我们将研究如何使用python中的pymongo库更新MongoDB中的现有文档。更新命令可帮助我们...
ML层次聚类(聚集和分裂聚类)
在数据挖掘和统计中, 层次聚类分析是一种聚类分析的方法, 其试图建立聚类的层次, 即基于层次的树型结构。 基本上, 有两种类型的层次聚类分析策略– 聚集聚类: 也称为自下而上的方法或分层的聚集聚类(H...
ML:在Python中使用SMOTE和Near Miss算法处理不平衡数据
本文概述 SMOTE(少数民族综合采样技术)–过度采样 NearMiss算法–欠采样 在机器学习和数据科学中, 我们经常遇到一个叫做数据分配不平衡, 通常发生在其中一类的观测值比其他类高或低得多的情况...
ML模糊聚类详细介绍和指南
先决条件: 机器学习中的聚类 什么是聚类? 聚类是一种无监督的机器学习技术, 可根据给定数据彼此之间的距离(相似性)将其分为不同的簇。 无监督k均值聚类算法将位于某个特定聚类中的任何点的值设置为0或1...
ML特征缩放指南–第2部分
特征缩放是一种在固定范围内标准化数据中存在的独立特征的技术。它是在数据预处理期间执行的, 以处理高度变化的幅度或值或单位。如果未进行特征缩放, 则机器学习算法将权衡更大的值, 更大的值, 并将较小的值...
ML特征缩放指南–第1部分
特征缩放是一种在固定范围内标准化数据中存在的独立特征的技术。它是在数据预处理期间执行的。 加工: 给定具有以下特征的数据集-年龄, 工资, BHK公寓, 其数据大小为5000人, 每个人具有这些独立的...
ML用于特征选择的额外树分类器
先决条件: 决策树分类器 极随机树分类器(额外树分类器)是一种整体学习技术, 可将在"森林"中收集的多个不相关的决策树的结果进行汇总, 以输出其分类结果。从概念上讲, 它与随机森林分类器非常相似, 唯...
ML信用卡欺诈检测详细示例
面临的挑战是识别欺诈性的信用卡交易, 以便不向信用卡公司的客户收取未购买商品的费用。 信用卡欺诈检测所涉及的主要挑战是: 每天都会处理大量数据, 并且模型构建必须足够快才能及时响应骗局。 数据不平衡,...