hadoop-3.3.4源码包
2023-01-05 17:26:35 33.98MB hadoop 大数据 3.3.4
1
基于hadoop平台hive数据库的taptap游戏平台大数据分析项目源码.zip 已获导师指导并通过的高分项目,下载即用,无需修改。 基于hadoop平台hive数据库的taptap游戏平台大数据分析项目源码.zip 已获导师指导并通过的高分项目,下载即用,无需修改。基于hadoop平台hive数据库的taptap游戏平台大数据分析项目源码.zip 已获导师指导并通过的高分项目,下载即用,无需修改。基于hadoop平台hive数据库的taptap游戏平台大数据分析项目源码.zip 已获导师指导并通过的高分项目,下载即用,无需修改。基于hadoop平台hive数据库的taptap游戏平台大数据分析项目源码.zip 已获导师指导并通过的高分项目,下载即用,无需修改。基于hadoop平台hive数据库的taptap游戏平台大数据分析项目源码.zip 已获导师指导并通过的高分项目,下载即用,无需修改。基于hadoop平台hive数据库的taptap游戏平台大数据分析项目源码.zip 已获导师指导并通过的高分项目,下载即用,无需修改。基于hadoop平台hive数据库的taptap游戏平
基于Hadoop的hive数据库的网站流量日志数据分析系统项目源码.zip 已获导师指导并通过的高分项目。下载即用,内附说明。项目背景 1、项目名 “网站流量日志数据分析系统” 2、概念 a、点击流 点击流(Click Stream)是指用户在网站上持续访问的轨迹,形成点击事件,它会记录用户浏览站点的整个过程。 image-20211123085322048 二、日志数据的数据格式 image-20211123090020444 页面点击流数据 image-20211123091013446 点击流模型Visits表 image-20211123091120698 三、骨灰级指标 1、IP 1天之内,不重复的ip数,统计ip数 2、PV 页面加载的总次数 3、UV 1天之内,访问网站的不重复用户数(以浏览器cookie为依据),一天内同一访客多次访问网站只被计算1次。 四、整体技术架构流程 1、数据采集 2、数据预处理 3、数据入库 4、数据分析 5、数据展示 image-20211201143716799 image-20211123114258257 五、技术分析
win8 上还是用32位的 cygwin吧,64位的cygwin 无法运行"ssh localhost"
2023-01-04 14:13:52 815KB cygwin hadoop windows linux
1
在Windows环境下开发spark程序,不可避免使用到部分Hadoop功能。为了避免在Windows上报错,给windows打补丁。
2023-01-04 13:25:08 626KB 大数据
1
分区Partitioner 分区操作是shuffle操作中的一个重要过程,作用就是将map的结果按照规则分发到不同reduce中进行处理,从而按照分区得到多个输出结果。 Partitioner是partitioner的基类,如果需要定制partitioner也需要继承该类HashPartitioner是mapreduce的默认partitioner。 计算方法是:which reducer=(key.hashCode() & Integer.MAX_VALUE) % numReduceTasks 注:默认情况下,reduceTask数量为1 很多时候MR自带的分区规则并不能满足我们需求,为了实
2023-01-03 20:20:54 101KB c ce do
1
Eclipse的Hadoop插件在开发hadoop应用程序中可以提供一些很方便的操作,可以直接Eclipse中浏览HDFS上的文件,可以直接新建选择MapReduce项目,项目自动包含所有需要的hadoop jar包,不必再手动拷贝。
2022-12-31 17:11:09 36.35MB hadoop eclipse 2.8.4 plugin
1
电子商务中会产生海量的数据,蕴含着不可估量的数据价值,可通过数据分析来挖掘这些潜在价值,以提升平台的销量。本次实践项目利用 Hadoop 的分布式计算框架 MapReduce 来分析用户行为数据,计算得出商品点击排行、商品分类占比等统计指标,使得更加熟练掌握 MapReduce 程序的设计。 相关理论知识有,Map 和 Reduce 流程图如下:输入数据(INPUT)首先分割(SPLIT)成若干份,然后每份分别进行 MAP 过程;中间再经过 COMBINE 任务(可选)和 PARTTION 对 MAP 所得的结果进行聚合——把同 key 的结果放到同一组,最后再进行 REDUCE 过程。
2022-12-31 12:22:06 4.19MB 电子商务 大数据 Hadoop MapReduce
1
使用MongoDB,Hadoop大数据和Spring技术开发电子商务应用程序 该电子商务项目展示了如何使用MongoDB,Hadoop大数据和Spring技术来开发电子商务应用程序。 该应用程序包括几个基本的电子商务组件:“产品目录”组件,“库存管理”组件和“产品类别”组件。 分片的MongoDB集群为产品目录数据,产品库存数据和其他应用程序数据提供存储。 应用程序域模型基于MongoDB POJO类构建。 建立了一个包含100000多种产品的示例数据库,以支持E-Commerce应用程序。 Hadoop大数据技术用于自动发现电子商务应用程序中数据的用户见解。 Hadoop集成主要通过开发Map / Reduce作业来实现。 已开发的Map / Reduce作业在MongoDB和Ubuntu平台上运行。 Spring和Spring Boot技术用于为电子商务应用程序提供系统集成平台。
2022-12-30 21:41:09 18.64MB Java
1
Hadoop mapreduce 实现InvertedIndexer倒排索引,能用。
2022-12-30 10:34:30 7KB Hadoop mapreduce 倒排索引
1