适合初学和巩固基础的人
2021-10-12 19:07:36 213KB scala 大数据 spark 知识点
Spark大数据分析:核心概念技术及实践
2021-09-13 21:46:47 88.21MB 大数据 Spark
1
Scala是一门以Java虚拟机(JVM)为目标运行环境并将面向对象和函数式编程语言的最佳特性结合在一起的编程语言。你可以使用Scala编写出更加精简的程序,同时充分利用并发的威力。由于Scala运行于JVM之上,因此它可以访问任何Java类库并且与Java框架进行互操作。本书从实用角度出发,给出了一份快速的、基于代码的入门指南。Horstmann以“博客文章大小”的篇幅介绍了Scala的概念,让你可以快速地掌握和应用。实际上手的操作,清晰定义的能力层次,从初级到专家级,全程指导。
2021-09-01 14:55:57 35.25MB scala 大数据 spark
1
本次作业要完成在Hadoop平台搭建完成的基础上,利用Spark组件完成文本词频统计的任务,目标是学习Scala语言,理解Spark编程思想,基于Spark 思想,使用IDEA编写SparkWordCount程序,并能够在spark-shell中执行代码和分析执行过程。
2021-08-24 09:21:49 1.2MB 大数据 spark hadoop
1
12.1 Spark概述 12.2 Spark生态系统 12.3 Spark运行架构 12.3 Spark SQL 12.3 Spark的部署和应用方式
2021-08-22 09:10:38 2.79MB 大数据导论 大数据 Spark big
大数据spark计算TopN的素材.rar
2021-08-17 09:12:42 1KB 大数据
1
Spark2.x企业级大数据项目实战(实时统计、离线分析和实时ETL),本门课程来源于一线生产项目, 所有代码都是在现网大数据集群上稳定运行, 拒绝Demo。课程涵盖了离线分析、实时分析绝大部分的场景,通过三个实际生产项目教授如何优雅地集成Hadoop、Spark、HBase、Kafka、Redis、MySQL等相关大数据技术,并实际落地 。
2021-08-09 13:17:46 1KB 大数据 spark
1
大数据实战之千万量级小说网站项目开发(存储、复杂搜索、推荐、分析),本次课程就是针对百万小说数据的推荐、热度、内容等进行搜索、推荐、分析的项目.让大家在真实数据的实战中真真正正的掌握大数据存储、搜索及推荐等内容。
2021-08-03 09:44:29 1KB 大数据 spark
1
大数据培训期间,课堂教材
2021-07-25 18:05:24 35.09MB 大数据 Spark 机器学习 机器学习实战
由于Spark基于内存计算的特性,集群的任何资源都可以成为Spark程序的瓶颈:CPU,网络带宽,或者内存。通常,如果内存容得下数据,瓶颈会是网络带宽。不过有时你同样需要做些优化,例如将RDD以序列化到磁盘,来降低内存占用。 本教程通过源码引导读者深入理解Spark的集群部署的内部机制、Spark内部调度的机制、Executor的内部机制、Shuffle的内部机制,进而讲述Tungsten的内部机制,让学员知其然知其所以然。教程的后部分,是任何Spark应用者都很好关注的Spark性能调优的内容。
1