机器学习与数据挖掘实验报告.7z
2022-07-02 11:04:34 1.49MB 机器学习与数据挖掘实验报告.7z
资源包含 * 1-3题的代码-基于jupyter notebook写的 * 赛题数据 * 借鉴的一些参考文文献 在我的博客里面其实已经将这些代码开源,数据也是,如果 特别提醒:建模思路已经第1-3问题已经在我的博客里面了 • 1.吸引顾客,稳定客源 • 2.发现竞争优势 • 3.游客满意度以及影响因素
2022-06-30 18:12:51 177.69MB 数据挖掘
为了提高大数据环境下的数据挖掘速度,对分布式计算构架Hadoop进行分析与研究,提出一种基于Hadoop平台的大数据关联规则挖掘算法MRPrePost。该算法在PrePost算法基础上改进而来,采用Hadoop平台降低分布式编程的难度且易于管理,通过一种自底向上的深度优化策略改进PrePost算法,降低内存开销,同时采用负载均衡的分组策略,来提高并行算法的性能,最终试验表明,该算法运行速度快,适应大数据关联规则挖掘。
1
随着移动智能操作系统技术的突破,智能手机的普及,移动互联网时代的到来,web app每天都在产生TB甚至PB级的web日志,如何从这些海量日志信息中提取用户的个人爱好及其他信息,为用户提供个性化推荐服务,为人们的生活带来便利,成为各大互联网公司和科研机构研究人员的研究热点。由于开源云计算平台Hadoop的出现,解决海量web日志信息的数据挖掘成为可能。 本文的研究内容主要包含以下几个方面: 一、对Hadoop云计算平台进行研究。Hadoop是Apache下的顶级开源项目,该平台能够利用成千上万的廉价计算机提供并行计算与存储服务。本文主要深入研究了Hadoop平台下的HDFS分布式文件系统,并行编程模型MapReduce,分布式列型存储数据库HBase。 二、对聚类分析进行研究。聚类分析是数据挖掘中应用极为广泛的一类,本文主要研究了聚类分析的起源、定义和样本相似距离,并详细介绍了聚类分析的常用方法。 三、基于Hadoop平台,设计并实现了数据挖掘系统,.,系统封装了底层的Hadoop系统接口,提供了本文介绍的几种聚类算法服务。系统自顶向下的逻辑层次分别为用户层、服务引擎层、挖掘引擎层、底层Hadoop驱动层。 四、研究分析了K-Means和PAM聚类算法
2022-06-28 21:06:42 9.23MB Hadoop 数据挖掘 算法
1
WEKA arff 实验数据集比较全数据挖掘实验的数据
2022-06-28 20:26:08 17.53MB weka arff 数据挖掘
1
《数据挖掘技术》-电子教案.rar
2022-06-26 20:04:07 6.7MB 教学资料
【字段】 电影名称、投票人数、类型、产地、上映时间、时长、年代、评分、首映地点 【用途】 该数据集非常适用了Python数据分析入门,是学习NumPy 、Pandas、Matplotlib的练手数据集
2022-06-26 19:09:06 2.92MB 数据分析 python 人工智能 数据挖掘
sas编程与数据挖掘商业案例笔记
SQL Server 2008 R2数据挖掘与商业智能基础及高级案例实战-案例文件.rar
2022-06-25 14:05:52 2.35MB 教学资料
讲了数据挖掘原理和算法,有监督学习与无监督学习,机器学习及深度学习
2022-06-24 17:35:33 23.03MB 数据挖掘 原理和算法
1