本书针对数据的海量性、复杂性、高维性、模糊性和不完整性,对数据挖掘技术中的聚类分析和关联规则分析进行了系统的研究。设计与实现了基于密度和自适应密度可达聚类算法、基于簇特征的动态增量聚类算法、并行聚类算法、基于密度加权的模糊聚类算法、高唯复杂数据聚类算法、基于数据场的聚类算法、基于距离的量化关联规则和基于数据场的量化关联规则算法,给出了在矿产资源评价、遥感图像分类、矿业经济分析中的应用例证。全书共分11章,主要内容包括:绪论,基于密度和密度可达聚类分析,基于簇特征的动态增量聚类分析,并行聚类分析,基于密度加权的模糊聚类分析,高唯复杂数据聚类分析,基于数据场的聚类分析,基于距离的量化关联规则,基于数据场的量化关联规则,数据挖掘结果可视化和数据挖掘算法应用。
2022-09-07 21:38:37 108.34MB 大数据挖掘
1
美的从制造到智造-数字化转型之路(1).pdf
2022-09-05 20:08:34 16.31MB 制造 数据分析 数据挖掘
基于attention文本分类代码基于attention文本分类代码基于attention文本分类代码
10多年程序猿经验总结openmv4形状识别
2022-09-01 18:05:42 337KB python 画图 数据挖掘
1
数据挖掘项目 推文聚类 目标: 主Twitter API用于提取推文 掌握自然语言处理 数据清理 推文分类 要求: Twitter开发人员帐户 Twitter API 1-数据提取: 导入库(tweepy +熊猫+ numpy) 连接到Twitter API 将推文提取到多个csv文件中,然后将它们组合到一个csv文件中 2-处理前的推文: 使用re库搜索不必要的信息。 删除标点符号,主题标签,个人资料名称,URL和表情符号。 创建一个新的干净的CSV文件 3-处理推文:自然语言处理 导入nltk(自然语言工具包),它由最常用的算法组成,例如标记化,词性标记,词干,情感分析,主题细分和命名实体识别。 NLTK帮助计算机分析,预处理和理解书面文本。 使用“停用词”摆脱英语单词,这些单词不会给句子增加太多含义。 在不牺牲含义的前提下,可以安全地忽略它们。 使用“ Porte
2022-08-31 21:34:30 1.86MB JupyterNotebook
1
该课件是南京大学软件学院数据挖掘课的课件,该课是南京大学软件学院企业计算方向的核心课程
2022-08-31 19:55:43 3.93MB 南京大学 数据仓库 数据挖掘 课件
1
中科大软院,数据挖掘与数据仓库课程的课堂讲义PPT。
1
信息论基础,熵,联合熵,条件熵,互信息,交叉熵
2022-08-27 22:05:11 5KB nlp 数据挖掘
1
鸢尾花数据集,数据挖掘的入门数据集
2022-08-26 09:08:24 5KB 数据挖掘
1
描述了电信用户是否流失以及其相关信息,共包含7044条数据,共20个字段,介绍下各个字段: customerID :用户ID。 gender:性别。(Female & Male) SeniorCitizen :老年人 (1表示是,0表示不是) Partner :是否有配偶 (Yes or No) Dependents :是否经济独立 (Yes or No) tenure :客户的职位(0-72,共73个职位) PhoneService :是否开通电话服务业务 (Yes or No) MultipleLines:是否开通了多线业务(Yes 、No or No phoneservice 三种) InternetService:是否开通互联网服务 (No, DSL数字网络,fiber optic光纤网络 三种) OnlineSecurity:是否开通网络安全服务(Yes,No,No internetserive 三种) OnlineBackup:是否开通在线备份业务(Yes,No,No internetserive 三种) DeviceProtection:是否开通了设备保护业务(Yes,
2022-08-22 12:05:06 172KB 数据挖掘 机器学习
1