导图社区 《Hadoop大数据处理》
《Hadoop大数据处理》以大数据处理系统的三大关键要素——“存储”、“计算”与“容错”为起点,深入浅出地介绍了如何使用Hadoop这一高性能分布式技术完成大数据处理任务。本书不仅包含了使用Hadoop进行大数据处理的实践性知识和示例,还以图文并茂的形式系统性地揭示了Hadoop技术族中关键组件的运行原理和优化手段,为读者进一步提升Hadoop使用技巧和运行效率提供了颇具价值的参考。
社区模板帮助中心,点此进入>>
论语孔子简单思维导图
《傅雷家书》思维导图
《童年》读书笔记
《茶馆》思维导图
《朝花夕拾》篇目思维导图
《昆虫记》思维导图
《安徒生童话》思维导图
《鲁滨逊漂流记》读书笔记
《这样读书就够了》读书笔记
妈妈必读:一张0-1岁孩子认知发展的精确时间表
大数据处理
大数据处理概论
1.1什么是大数据
1.2数据处理平台的基础架构
1.3大数据处理的存储
1.4大数据处理的计算模式
1.5大数据处理系统的容错性
基于Hadoop的大数据处理架构
2.1Google核心云计算技术
2.2Hadoop云计算技术及发展
2.3基于云计算的大数据处理架构
2.4基于云计算的大数据处理技术的应用
2.5Hadoop运行实践
MapReduce计算模式
3.1MapReduce原理
3.2MapReduce工作机制
3.3MapReduce应用开发
3.4MapReduce设计模式
3.5MapReduce算法实践
3.6MapReduce性能调优
使用HDFS存储大数据
4.1大数据的云存储需求
4.2HDFS架构与流程
4.3文件访问与控制
4.4HDFS性能优化
4.5HDFS的小文件存储问题
4.6HDFS的高可用性问题
HBase大数据库
5.1大数据环境下的数据库
5.2HBase架构与原理
5.3管理HBase中的数据
5.4从RDBMS到HBase
5.5在HBase上运行MapReduce
5.6HBase性能优化
大数据的分析处理
6.1大数据的分析处理概论
6.2Hive
6.3Pig
6.4Hive和Pig的对比
Hadoop环境下的数据整合
7.1Hadoop计算环境下的数据整合问题
7.2数据库整合工具Sqoop
7.3Hadoop平台内部数据整合工具HCatalog
Hadoop集群的管理和维护
8.1云计算平台的管理体系
8.2Zookeeper——集群中的配置管理与协调者
8.3Hadoop集群监控的基础组件
8.4Ambari——Hadoop集群部署与监控集成工具
8.5基于Cacti的Hadoop集群服务器监控
8.6Chukwa——集群日志收集分析
8.7基于Kerberos的Hadoop安全管理
8.8Hadoop集群管理工具分析
基于MapReduce的数据挖掘
9.1数据挖掘及其分布式并行化
9.2基于MapReduce的数据挖掘与Mahout
9.3经典数据挖掘算法的MapReduce实例
9.4基于云计算的数据挖掘实践及面临的挑战
面向未来的大数据处理
10.1下一代计算框架YARN
10.2大数据的实时交互式分析
10.3大数据的图计算