导图社区 大数据Hadoop3.0分布式处理实战
本书共 14 章,前 4 章主要讲解和演示大数据与 Hadoop 概述、Hadoop 伪分布式安装、HDFS 分布式文件系统、MapReduce 分布式计算框架。第 5 到 11 章讲解了 Hadoop 生态的常用组件,包括 NoSQL 数据库 HBase、分布式数据仓库 Hive、数据转换工具 Sqoop、内存计算框架 Spark。最后 3 章讲解了 3 个企业级的大型大数据综合实战项目。
揭秘出租车数据背后的城市脉搏!本项目基于Spark和MLlib技术,从时空双维度解析出租车订单数据:先通过探索性分析挖掘订单规律(如每小时/周/月趋势),再构建线性回归和随机森林模型预测车费(含降雪、湿度特征)同时利用Spark SQL和GeoPandas绘制机场车流热力图,实现从数据预处理(读取、清洗)到模型评估(统计可视化)的全流程闭环,为城市交通规划提供数据洞察。
19世纪后期,洋务运动以"自强""求富"为口号,创办新式学堂与早期工业,却因封建性依赖而随北洋海军覆没告终维新派随后发起变法图存运动,推动思想启蒙与政治改良,但因资产阶级软弱性及局限性失败两场运动虽未达目标,但开创学习西方风气,促进近代教育发展,其兴衰历程深刻揭示了封建体制转型的困境与民族觉醒的曲折道路。
这是一篇关于法学基础理论核心概念解析的思维导图,主要内容包括:法律概念、法律规则、法律原则和法律条文四个概念的对比,法律规范性文件的来源,法律规则,法的本质和法的最终决定因素,法的四个作用,法理学中的四种原则,法理学中非正式法律解释和正式法律解释。
社区模板帮助中心,点此进入>>
互联网9大思维
组织架构-单商户商城webAPP 思维导图。
域控上线
python思维导图
css
CSS
计算机操作系统思维导图
计算机组成原理
IMX6UL(A7)
考试学情分析系统
大数据Hadoop3.0分布式处理实战
Hadoop技术
大数据与Hadoop概述
大数据概述
Hadoop概述
Hadoop伪分布式安装
Hadoop伪分布式安装前的准备
Hadoop验证
Hadoop分布式文件系统—HDFS
HDFS原理
HDFS Shell
HDFS Java API
分布式计算框架MapReduce
MapReduce原理
MapReduce编程基础
MapReduce综合实例
数据去重
数据排序
求学生平均成绩
WordCount高级示例
Hadoop生态系统的主要大数据工具整合应用
NoSQL数据库HBase
HBase原理
HBase伪分布式安装
HBase Shell
HBase高级特性
HBase Java API
HBase与MapReduce的整合
分布式数据仓库Hive
Hive概述
Hive分布式安装
Hive QL的基础功能
Hive QL的高级功能
Hive高级特性
Beeline
Hive JDBC
Hive函数
Hive表的高级特性
数据转化工具Sqoop
Sqoop概述与安装
Sqoop导入数据
Sqoop导出数据
深入理解Sqoop的导入与导出
内存计算框架Spark
Spark入门
Spark Streaming
Spark SQL
Hadoop及其常用组件集群安装
Hadoop集群安装
HBase集群安装
Hive集群安装
Spark集群安装
实战篇
海量Web日志分析系统
案例介绍
案例分析
案例实现
电商商品推荐系统
案例设计
分布式垃圾消息识别系统
RPC远程方法调用的设计
数据分析设计