上传者: 43934844
|
上传时间: 2022-06-21 13:04:27
|
文件大小: 2.28MB
|
文件类型: PPTX
"大量化(Volume)、多样化(Variety)、快速化(Velocity)、价值密度低(Value)"就是"大数据"的显著特征,或者说,只有具备这些特点的数据,才是大数据。 Volume Velocity Value Variety 大数据的4V特征 2大数据介绍全文共34页,当前为第1页。 海量数据的高存储成本 大数据量下的数据处理性能不足 流式数据处理缺失 有限的扩展能力 数据扩展性需求和硬件性能之间存在差距 传统的数据处理系统面临的问题,呼唤新的技术 2大数据介绍全文共34页,当前为第2页。 1 目前数据系统架构存在问题 2大数据介绍全文共34页,当前为第3页。 数据抽取、转换、装载过程 数据相互转移 分布式文件系统 海量结构化存储系统 机器学习、数据挖掘、语义搜索 PowerView 动态图表 数据采集 数据预处理 数据存储 数据分析挖掘 结果展现 海量非结构化存储系统 一、大数据处理流程简析 2大数据介绍全文共34页,当前为第4页。 大数据处理的基本流程 整个大数据的处理流程可以定义为:在合适工具的辅助下,对广泛异构的数据源进行抽取和集成,结果按照一定的标准进行统一存储,