本书是一本Hadoop学习入门参考书 全书共11章 分为基础篇和提高篇两部分。基础篇包括靠前~6章 具体包括Hadoop概述、Hadoop基础环境配置、分布式存储HDFS、计算系统MapReduce、计算模型Yarn、数据云盘。提高篇包括D17~11章 具体包括协调系统Zookeeper、Hadoop数据库Hbase、Hadoop数据仓库Hive、Hadoop数据采集Flume、OTA离线数据分析平台。全书内容结构合理 知识点全面 讲解详细 重点难点突出。 本书适合作为院校计算机及相关专业大数据课程的教材 也可供学习者自学参考。
2022-03-10 09:08:57 133.21MB Hadoop 大数据 项目实战
1
车流量监控 前言 目的1.对业务场景抽象,熟练的Spark编码2.增加自定义累加器,自定义UDF 3.Spark优化方式 项目数据处理架构 模块介绍 卡扣流量分析Spark Core 卡扣车流量转化率Spark Core 各区域车流量最高top5的道路统计SparkSQL 稽查布控,道路实时拥堵统计SparkStreaming 蜂巢表 monitor_flow_action表–日期日期天– monitor_id卡口号– camera_id摄像头编号–汽车车牌– action_time某个摄像头拍摄时间s –速度通过卡扣的速度– road_id道路id – area_id区域ID monito
2022-02-27 03:26:20 17.17MB java scala kafka spark
1
01_大数据项目的开发流程 02_大数据的应用领域(一) 03_大数据的应用领域(二) 04_大数据分析平台(一) 05_大数据分析平台(二) 06_数据量及集群规模的规划(一) 07_数据量及集群规模的规划(二) 08_企业常见数据分析需求(一) 09_企业常见数据分析需求(二)
2022-02-17 14:15:27 332.04MB 大数据 Hadoop 大数据开发 大数据分析平台
08-电视收视率企业项目实战(hadoop+Spark) 06-友盟网大数据 05-大数据电商城 04-友盟网-大数据 03-用户画像 02-团购网站标签生成 01-电信电话项目
2021-12-16 15:29:30 312B 大数据
1
虚拟机和linux相关知识和基础操作
2021-12-09 11:00:33 4.32MB linux
1
尚硅谷公开课-大数据项目实战--智慧出行
2021-12-05 20:22:29 64B 大数据 J2EE 智慧出行 实战
1
大数据项目之电商数仓(2业务数据采集平台)V4.1.docx
2021-10-26 15:07:25 8.63MB 资料
1
一个关于使用大数据实现电影评价的项目,主要使用Hive来实现各项指标,中间涉及hive相关优化
2021-10-17 21:01:05 5.71MB 大数据 影评项目 SQL Hive
1
此数仓项目文档详细介绍从项目需求分析到数据生成模块、数据采集模块、数仓各分层搭建再到业务实现的过程,其中各种环境的配置很细致,很有价值学习一下。
大数据简历 内含三个项目: 项目一:联通大数据项目 项目名称: 移动终端上网数据实时分析处理系统; 开发环境: IDEA+eclipse+maven+jdk 系统架构: hadoop+zookeeper+flume+Spark+hive+mysql+sqoop+Oracle 项目二:联通大数据项目 项目名称: 信令数据实时分析处理系统; 开发环境: IDEA+eclipse+maven+jdk 系统架构: hadoop+zookeeper+Spark+hive+mysql+sqoop+Oracle 项目三:网络爬虫 项目名称: 爬取电商网站商品信息 开发环境: eclipse+mysql+maven+jdk+svn 系统架构: hadoop+zookeeper+httpclient+htmlcleaner+hbase+redis+solr+flume+kafka+storm
2021-09-04 11:21:00 53KB 简历 大数据 招聘 程序员
1