IT技术 使用Apache POI在Java中的Excel文件中创建图纸 对于给定的Excel文件(此处极客), 则需要在其中创建表格。 步骤如下: 创建一个JAVA Maven项目 在pom.xml文件中添加依赖项 <!-- https://mvnrepositor... 05月11日 1,175 次浏览 发表评论 阅读全文
IT技术 ML:机器学习中的数据简介 数据: 可以是任何未经解释和分析的未经处理的事实, 值, 文本, 声音或图片。数据是所有数据分析, 机器学习和人工智能中最重要的部分。没有数据, 我们就无法训练任何模型, 所有现代研究和自动化都将徒劳... 05月06日 1,221 次浏览 发表评论 阅读全文
IT技术 ML机器学习类型–第2部分 无监督学习: 这是一种学习, 我们在训练时不给模型指定目标, 即训练模型仅输入参数值。该模型本身必须找到可以学习的方式。图A中的数据集是购物中心数据, 其中包含订阅其客户的客户的信息。订阅后, 他们将... 05月04日 911 次浏览 发表评论 阅读全文
IT技术 ML机器学习:了解数据处理 数据处理是将数据从给定格式转换为更加有用和期望的格式的任务, 即使其更有意义和更有意义。使用机器学习算法, 数学建模和统计知识, 可以使整个过程自动化。根据我们正在执行的任务和机器的要求, 此完整过程... 05月04日 850 次浏览 发表评论 阅读全文
IT技术 ML使用SVM对非线性数据集执行分类 先决条件: 支持向量机 超平面和SVM分类器的定义: 对于具有n个特征的线性可分离数据集(因此需要n个维表示), 超平面基本上是一个(n – 1)维子空间, 用于将数据集分为两组, 每个组包含属于不同... 05月04日 1,082 次浏览 发表评论 阅读全文
Python ML:在Python中使用SMOTE和Near Miss算法处理不平衡数据 本文概述 SMOTE(少数民族综合采样技术)–过度采样 NearMiss算法–欠采样 在机器学习和数据科学中, 我们经常遇到一个叫做数据分配不平衡, 通常发生在其中一类的观测值比其他类高或低得多的情况... 05月02日 2,369 次浏览 发表评论 阅读全文
Python ML用于特征选择的额外树分类器 先决条件: 决策树分类器 极随机树分类器(额外树分类器)是一种整体学习技术, 可将在"森林"中收集的多个不相关的决策树的结果进行汇总, 以输出其分类结果。从概念上讲, 它与随机森林分类器非常相似, 唯... 05月02日 1,605 次浏览 发表评论 阅读全文
IT技术 向Pandas中的现有DataFrame添加新列 让我们讨论一下如何向Pandas中的现有DataFrame添加新列。我们可以通过多种方式完成此任务。 方法1:通过将新列表声明为一列。 # Import pandas package import p... 04月18日 1,729 次浏览 发表评论 阅读全文
IT技术 Python中的列联表介绍和用法示例 在单变量数据分析的情况下, 均值, 中位数, 标准差和方差之类的估计非常有用。但是在双变量分析(比较两个变量)的情况下, 相关性发挥了作用。 列联表是探索两个或更多变量的技术之一。基本上, 它是两个或... 04月16日 1,721 次浏览 发表评论 阅读全文
IT技术 如何设置Anaconda路径到环境变量? Anaconda是一个开源软件, 其中包含Jupyter, spyder等, 用于大型数据处理, 数据分析和重型科学计算。 Anaconda为R和python编程语言。 Spyder(Anaconda... 03月18日 944 次浏览 发表评论 阅读全文