导图社区 数据科学与大数据导论
这是一篇关于数据科学与大数据导论的思维导图,主要内容包括:第1章 大数据概述,第2章 大数据与其他新兴技术的关系,第3章 大数据基础知识,第4章 大数据的应用,第5章 大数据的硬件环境,第6章 数据采集与预处理,第7章 数据存储与管理,第8章 数据处理与分析,第9章 数据可视化,第10章 大数据分析综合案例。
这是一篇关于第二章 数据库与数据表管理精要的思维导图,主要内容包括:2.1 数据模型,2.2 数据库的基本操作,2.3 MySQL数据类型,2.4 数据库表的基本操作,2.5 条件约束,本章总结。
这是一篇关于大数据导论学习路线大纲的思维导图,主要内容包括:大数据基础概念,大数据技术架构,大数据分析方法,大数据应用案例,大数据相关法规与伦理,大数据工具与平台,大数据项目管理,大数据未来趋势与挑战。
社区模板帮助中心,点此进入>>
论语孔子简单思维导图
《傅雷家书》思维导图
《童年》读书笔记
《茶馆》思维导图
《朝花夕拾》篇目思维导图
《昆虫记》思维导图
《安徒生童话》思维导图
《鲁滨逊漂流记》读书笔记
《这样读书就够了》读书笔记
妈妈必读:一张0-1岁孩子认知发展的精确时间表
数据科学与大数据导论
第1章 大数据概述
1.1 数据
数据的概念、类型、组织形式、生命周期、使用、价值
数据爆炸、数商
数据量大、数据类型繁多、处理速度快、价值密度低
1.2 大数据时代
第三次信息化浪潮
信息科技为大数据时代提供技术支撑
数据产生方式的变革促成大数据时代的来临
1.3 大数据的发展历程
1.4 世界各国的大数据发展战略
美国、英国、欧盟、韩国、日本、中国
1.5 大数据的影响
对科学研究、社会发展、就业市场、人才培养的影响
1.6 大数据的应用
在各个领域的应用
应用的3个层次
1.7 大数据产业
1.8 大数据与数字经济
数字经济
大数据与数字经济的紧密关系
1.9 高校的大数据专业
专业概述、专业体系、编程语言
1.10 本章小结
1.11 习题
第2章 大数据与其他新兴技术的关系
2.1 云计算
概念、服务模式和类型、数据中心、应用和产业
2.2 物联网
概念、关键技术、应用、产业链
2.3 大数据与云计算、物联网的关系
2.4 人工智能
概念、关键技术、应用、产业
大数据与人工智能的关系
2.5 区块链
比特币概述、原理、定义和应用
大数据与区块链的关系
2.6 元宇宙
概念、基本特征、核心技术
大数据与元宇宙的关系
2.7 本章小结
2.8 习题
第3章 大数据基础知识
3.1 大数据安全
传统数据安全
大数据安全与传统数据安全的不同
大数据时代数据安全面临的挑战、问题分类、具体安全威胁
典型案例
3.2 大数据思维
传统的思维方式
大数据时代需要新的思维方式
大数据思维方式、运用实例
3.3 大数据伦理
概念、典型案例、伦理问题
3.4 数据共享
数据孤岛问题(产生原因、消除意义)
实现数据共享面临的挑战、推进举措
数据共享案例
3.5 数据开放
政府开放数据的理论基础
政府信息公开与政府数据开放的联系与区别
政府数据开放的重要意义
3.6 大数据交易
概述、发展现状、交易平台
3.7 大数据治理
概述、要素和原则、范围
3.8 本章小结
3.9 习题
第4章 大数据的应用
4.1 互联网领域
4.2 生物医学领域
流行病预测、智慧医疗、生物信息学
4.3 物流领域
智能物流概念、大数据的关键作用
中国智能物流骨干网菜鸟
4.4 城市管理领域
智能交通、环保监测、城市规划、安防
4.5 金融领域
高频交易、市场情绪分析、信贷风险分析、大数据征信
4.6 汽车领域
4.7 零售领域
发现关联购买行为、客户群体细分、供应链管理
4.8 餐饮领域
餐饮领域拥抱大数据、餐饮O2O
4.9 电信和能源领域
4.10 体育和娱乐领域
训练球队、投拍影视作品、预测比赛结果
4.11 安全领域
大数据与国家安全
应用大数据技术防御网络攻击
警察应用大数据工具预防犯罪
4.12 日常生活领域
4.13 本章小结
4.14 习题
第5章 大数据的硬件环境
5.1 服务器的性能指标
5.2 服务器的分类及选购
5.3 系统的性能评估
CPU、内存、存储、网卡
5.4 硬件系统分析
5.5 网络设备
5.6 系统组网方案设计
网络需求分析、网络结构设计
5.7 数据中心
分类、组成、上线
5.8 本章小结
5.9 习题
第6章 数据采集与预处理
6.1 数据采集
概念、三大要点、数据源、方法
网络爬虫
6.2 数据清洗
应用领域、实现方式、内容、注意事项
基本流程、评价标准、行业发展
6.3 数据集成和数据转换
数据集成、数据转换
6.4 数据归约
6.5 数据脱敏
6.6 本章小结
6.7 习题
第7章 数据存储与管理
7.1 传统的数据存储与管理技术
文件系统、关系数据库、数据仓库、并行数据库
7.2 大数据时代的数据存储与管理技术
分布式文件系统、NewSQL和NoSQL数据库
云数据库、数据湖
7.3 大数据处理架构Hadoop
特性、生态系统
7.4 分布式文件系统HDFS
设计目标、体系结构
7.5 NoSQL数据库
键值数据库、列族数据库、文档数据库、图数据库
7.6 云数据库
概念、特性、与其他数据库的关系
代表性产品
7.7 分布式数据库HBase
Bigtable概述、HBase简介
HBase的数据模型、系统架构
7.8 Spanner
7.9 OceanBase
7.10 本章小结
7.11 习题
第8章 数据处理与分析
8.1 数据处理与分析的概念
8.2 基于统计学方法的数据分析
常见方法、主流工具
8.3 机器学习和数据挖掘算法
概述
分类、聚类、回归分析、关联规则、协同过滤
8.4 数据挖掘的方法体系
可挖掘的知识、系统体系结构、流程
8.5 大数据处理与分析技术
技术分类、流计算、图计算
8.6 大数据处理与分析的代表性产品
分布式计算框架MapReduce、数据仓库Hive/Impala
基于内存的分布式计算框架Spark
机器学习框架TensorFlowOnSpark
流计算框架Flink、大数据编程框架Beam
查询分析系统Dremel
8.7 本章小结
8.8 习题
第9章 数据可视化
9.1 可视化概述
简介、发展历程、重要作用
9.2 可视化图表
9.3 可视化工具
入门级工具、信息图表工具、地图工具
时间线工具、高级分析工具
9.4 本章小结
9.5 习题
第10章 大数据分析综合案例
10.1 案例任务
10.2 系统设计
总体设计、数据库设计、网站设计、算法设计
10.3 技术选择
10.4 系统实现
10.5 本章小结
10.6 习题