英文原版论文pdf 1. 2003年,Google发布Google File System论文,这是一个可扩展的分布式文件系统,用于大型的、分布式的、对大量数据进行访问的应用。它运行于廉价的普通硬件上,提供容错功能。从根本上说:文件被分割成很多块,使用冗余的方式储存于商用机器集群上。 2. 紧随其后的就是2004年公布的 MapReduce论文,论文描述了大数据的分布式计算方式,主要思想是将任务分解然后在多台处理能力较弱的计算节点中同时处理,然后将结果合并从而完成大数据处理。 3. 最后就是谷歌发布于2006年的Bigtable,其启发了无数的NoSQL数据库,比如:Cassandra、HBase等等。Cassandra架构中有一半是模仿Bigtable,包括了数据模型、SSTables以及提前写日志(另一半是模仿Amazon的Dynamo数据库,使用点对点集群模式)。
1
利用MapReduce实现了求学生成绩的最大值,最小值,及成绩分布。结合我的博客“MapReduce之学生平均成绩”看,效果更好。
2021-05-31 09:03:58 7KB MapReduce 成绩统计
1
这是我基于MapReduce实现的Kmeans算法,用Java语言,在一个完全分布式系统运行良好
2021-05-29 18:07:35 14KB Kmeans MapReduce
1
Hadoop下的Maven项目的日志文件
2021-05-29 09:07:02 938B hadoop Java mapreduce
1
单源最短路径算法(MapReduce)源代码,对与hadoop的初学者来说是很好的入门教程
2021-05-27 10:26:21 126KB mapreduce hadoop 最短路径
1
学习大数据知识点经典论文!google发表的MapReduce、GFS、Bigtable三大论文中文版。
2021-05-25 18:35:38 2.41MB 大数据 经典论文 MapReduce GFS
1
mapreduce案例测试数据
2021-05-18 09:07:05 618B hadoop
1
mapreduce案例测试数据
2021-05-18 09:07:04 84B hadoop
1
mapreduce案例测试数据
2021-05-18 09:07:04 60B hadoop
1
Hadoop MapReduce原理与JVM远程调试
2021-05-18 09:03:54 1.81MB Hadoop
1