详细描述了ID3算法的Java实现,代码清晰,含有注释
2022-06-21 17:27:38 15KB 数据挖掘
1
大数据 vs 数据挖掘 大数据-数据挖掘全文共13页,当前为第1页。 大数据是什么 大数据(big data,mega data),或称巨量资料,指的是需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。 大数据与云计算的关系就像一枚硬币的正反面一样密不可分。 HACE定理:大数据是巨大,无中心循环自生的,关系复杂且变化的。 1998: Big Data and the Next Wave of … 2005: Web 2.0 2006: Google Analytic 2012: Facebook IPO 大数据-数据挖掘全文共13页,当前为第2页。 大数据的纬度 数据 技术 创意 大数据-数据挖掘全文共13页,当前为第3页。 数据挖掘是什么 数据挖掘(英语:Data mining),又译为资料探勘、数据采矿。它是数据库知识发现(KDD)中的一个步骤。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统和模式识别等诸多方法来实现上述目标。 各种来源
2022-06-21 17:06:12 4.19MB 文档资料
大数据与数据挖掘 华艺园林股份有限公司 2017.6.23 大数据与数据挖掘全文共18页,当前为第1页。 阿里(菜鸟)与顺丰之争 2017.3-4月 菜鸟要求顺丰返回所有快递柜(丰巢)包裹信息,即所有的快递柜信息的触发必须通过菜鸟裹裹,取件码信息要无条件给菜鸟,丰巢要返回所有包裹信息给菜鸟,无论此件是否来自淘宝系平台,顺丰不同意 2017.5.27 菜鸟邮件通知顺丰自 5.31 日停用数据接口,下线顺丰接口。 (5月31日晚上6点,接到顺丰发来的数据接口暂停告知。6月1日凌晨,顺丰就关闭了自提柜的数据信息回传) 2017.6.1 菜鸟称收到顺丰发来数据接口暂停通知(顺丰突然关闭了物流数据接口) 2017.6.1 顺丰称丰巢接口信息是菜鸟方面于 6 月 1 日 0 点下线的。(菜鸟之所以封杀顺丰,背后原因是阿里方面希望顺丰放弃使用腾讯云改用阿里云。) 2017.6.2 顺丰连发两条告示,指责菜鸟未披露实情 2017.6.3 菜鸟和顺丰在中国邮政局主持下和解。 大数据与数据挖掘全文共18页,当前为第2页。 背后数据之争 顺丰:我的快递业务以商务件为主,不完全依赖淘宝件,且我从未放弃过电商,
2022-06-21 17:05:45 1.45MB 文档资料
大数据之数据挖掘技术.ppt该文档详细且完整,值得借鉴下载使用,欢迎下载使用,有问题可以第一时间联系作者~
2022-06-21 17:05:28 1.18MB 文档资料
目录 1. 绪论 2 1.1项目背景 2 1.2 提出问题 2 2 数据库仓库与数据集的概念介绍 2 2.1数据仓库 2 2.2数据集 2 3 数据仓库 3 3.1 数据仓库的设计 3 3.1.1数据仓库的概念模型设计 3 3.1.2数据仓库的逻辑模型设计 3 3.2 数据仓库的建立 3 3.2.1数据仓库数据集 3 3.2.2建立维表 4 4.数据挖掘操作 4 4.1数据预处理 4 4.1.1描述性数据汇总 4 4.2决策树 4 5、实验心得 12 6、大总结 12 绪论 1.1项目背景 在现在大数据时代,各行各业需要对商品及相关关节的数据进行收集处理,尤其零售 行业,于企业对产品的市场需求进行科学合理的分析,从而预测出将来的市场,制定出 高效的决策,给企业带来经济收益。 1.2 提出问题 对于超市的商品的购买时期和购买数量的如何决定,才可以使销售量最大,不积压商 品,不缺货,对不同时期季节和不同人群制定不同方案,使企业收益最大,通过数据挖 掘对数据进行决策树分析,关联分析,顺序分析与决策分析等可以制定出最佳方案。 2 数据库仓库与数据集的概念介绍 2.1数据仓库 数据仓库是为企业所
2022-06-21 17:05:20 418KB 文档资料
《 2020年报告》首次通过主观幸福感对全球城市进行排名,并更深入地探讨了社会,城市和自然环境如何结合在一起影响我们的幸福。幸福分数和排名使用盖洛普世界民意调查的数据。分数基于对民意调查中提出的主要生活评估问题的答案。分数来自2015-2020年全国代表性的样本,并使用盖洛普权重使估算值具有代表性。幸福评分后面的各栏估算了六个因素(经济生产,社会支持,预期寿命,自由,没有腐败和慷慨)中每个因素在何种程度上有助于使每个国家的生活评价高于反乌托邦,一个假设的国家,其六个因素的价值均等于世界最低的国家平均值。
2022-06-21 14:02:15 66KB 数据分析 聚类 文档资料 数据挖掘
1
现有某高校评教数据(pjsj.xls),共计842门课程,属性包括:课程名称、评价人数、总平均分以及10个评价指标Index1-Index10。以此为研究数据,利用数据挖掘的技术实现评价指标的筛选,即从10个指标中剔除对教学评价无用的指标。具体实现的内容应至少包括以下几个方面但不限于: (1)数据描述:利用盒图对每个指标数据进行描述性分析,画出10个指标的盒图:标注孤立点(如有)、最小值、Q1、中位数、Q3、最大值; (2)数据预处理:将每个连续型指标数据离散化为三个区间,级别从高到低分别为Excellent(用“E”表示)、Good(用“G”表示)、Fair(用“F”表示);将总平均分离散为“A”、“B”、“C”三个等次,作为每门课程的类标签; (3)模型构建与评估:利用决策树算法对上述数据进行分类,构建决策树并进行性能评估:包括Recall(召回率)、Precision(精度)、F1和Accuracy(准确率); (4)结果讨论:对研究结果(剔除的指标,即未出现决策树中的指标)进行讨论分析; (5)总结与展望:对全文研究过程进行总结并指出存在的不足或努力方向。
2022-06-20 14:07:48 8.74MB 数据挖掘 weka 期末大作业 决策树
用于本项目的数据分析及可视化部分的源码
2022-06-18 16:28:25 342KB 源码软件 数据分析 数据挖掘
1
数据挖掘在餐饮业的应用,刘志磊,,近些年来数据挖掘发展迅速,而且在一些商业应用中取得了很大进展,比如在零售业中,帮助店主合理安排商品的摆放、进货数量及时机
2022-06-17 11:42:59 539KB 数据挖掘
1
数据挖掘方法与应用.zip
2022-06-17 09:07:47 167.69MB 配套教学资源包