导图社区 大数据基础平台
大数据平台知识体系,大数据平台,它基于开源Hadoop框架开发,融合MPP、SQL on Hadoop、流处理等大数据技术,支持海量数据的高效储存和统一管理,为企业决策提供实时的数据支撑。
数据治理知识体系,数据是一种表示方法,它代表的是除自身以外的事物。数据既是对其所代表对象的解释,也是必须解释的对象。
这是一篇关于如何利用复盘思维提升工作能力的思维导图,主要内容包括:二、复盘步骤,六、结论与总结,五、复盘的效果评估,四、复盘工具,三、复盘角度,一、复盘思维介绍。
这是一篇关于17种头脑风暴法头脑风暴的思维导图,主要内容包括:持续创作!,像写信一样写东西,用完全不同的方式创造,在很随机的时间起床,利用社交媒体获得反馈,在观众面前头脑风暴,戒掉所有的科技产品,阅读,进行一场“点子风暴”,带根笔散步,边写边说,全部都用记忆搭建,把你想说的画下来,用你的非惯用手写字,头脑风暴每个不可能的想法,每天写下10个想法,“J.K. 罗
社区模板帮助中心,点此进入>>
互联网9大思维
组织架构-单商户商城webAPP 思维导图。
域控上线
python思维导图
css
CSS
计算机操作系统思维导图
计算机组成原理
IMX6UL(A7)
考试学情分析系统
大数据基础平台
平台简介
大数据平台。它基于开源Hadoop框架开发,融合MPP、SQL on Hadoop、流处理等大数据技术,支持海量数据的高效储存和统一管理,为企业决策提供实时的数据支撑。非结构化融合存储的混合应用场景。
平台特点
多源数据接入
支持MySql等关系型数据库、MQTT等传输协议,可实现物联网、电子交易等结构化、半结构化、非结构化数据的统一接入。
海量数据存储
采用分布式集群架构,具有很高的容错性、稳定性和可用性,可支持TB、PB级以上结构化与非结构化数据存储。
高效数据计算
集成MapReduce、Spark、Flink等多种计算框架,利用YARN资源管理做统一管理,可在海量数据集上同时进行离线计算和流式处理,满足高吞吐、大数据量和低时延实时处理等多方面的数据计算要求。
统一运维管理
提供基于Web的可视化集成管理控制台工具,支持对集群、节点、服务、组件等诸多对象的管理,帮助用户及时了解整个平台系统运行状态,并且提供健康预警和实时监测,实现大数据平台的极简管理。
功能清单
Cloudera Manager (或自研管理平台)
集群管理
对大数据集群进行管理,例如节点添加,修改,删除等
集群监控
监控集群健康情况,对设置的各种指标和系统运行情况进行全面监控
集群诊断
对集群出现的问题进行诊断,对出现的问题给出解决方案
组件管理
对大数据存储,计算组件进行管理,包括分布式部署,节点角色分配等,增删改等