导图社区 Hbase第一二章思维导图
Hbase超级详细思维导图,Hbase是分布式的存储数据库、HBase架构、HBase集群的搭建、数据的模型及表的设计等。
社区模板帮助中心,点此进入>>
论语孔子简单思维导图
《傅雷家书》思维导图
《童年》读书笔记
《茶馆》思维导图
《朝花夕拾》篇目思维导图
《昆虫记》思维导图
《安徒生童话》思维导图
《鲁滨逊漂流记》读书笔记
《这样读书就够了》读书笔记
妈妈必读:一张0-1岁孩子认知发展的精确时间表
Hbase第一二章思维导图
第一章HBase基础知识
Hbase是分布式的存储数据库
集群和分布式
集群:多个节点干相同的事
分布式:多个节点协同完成一件事,每个节点干不同的事情
存储数据
与MySQL(关系型数据库)的区别
数据类型:关系型数据库拥有丰富的数据类型,HBase采用简单的数据模型(未经解释的字符串)
数据操作:关系型数据库各种花里胡哨,HBase只有简单的插入、查询、删除、清空
存储模式:关系型数据库基于行,HBase基于列
数据更新:关系型数据库的更新就是覆盖,HBase生成新的版本后并不会删除旧值
可伸缩性:关系型数据库很难横向扩展,HBase可以灵活水平扩展
HDFS与HBase
HDFS存的数据,没有结构,无法快速查询。
HBase架构
HBase的描述
可伸缩
面向列
高性能
高可靠
Hbase架构图
zookeeper
关联数据
高可用
管理集群
HDFS(底层存储数据)
HBase
Master(管理集群)
RegionServer
Hlog
Region(分区)
Store
MemStore(写缓存)
HFile(读缓存)
HBase集群的搭建
1、部署zookeeper和Hadoop集群
2、上传HBase压缩包 解压
3.修改配置文件
4.启动
第二章 ‘数据的模型及表的设计
HBase Shell
bin/start-hbase.sh(未配置环境变量)|start-hbase.sh(配置了环境变量)
bin/hbase shell
help(寻求帮助,可以知道一些命令)
ctrl+退格:在HBase中删除
list查看表
创建表:create'表','列族'
插入数据到表:put'表名','行键','列族:列','列值'
扫描查看表数据
scan'表名':查看整个表
scan'表名',{STARTROW=>'行键',STOPROW=>'行键'}:根据行键查找
scan'表名',{STARTROW=>'行键'}
查看表结构:describe'student'
更新指定字段的数据
put'表名','行键','列族:列','列值'
查看指定行,指定列的数据
get'表名','行键'
get'表名','行键','列族:列'
删除表数据
删除某一行的某一列的数据
delet'表名','行键','列族:列'
清空表数据:truncate'表名'(要先disable)
删除表(要先disable)
1.disable'表名'
2.drop'表名'
统计表行数;count'student'
变更表信息(将列族中的数据存放三个版本)
alter'表名',{列=>'列族',VERSIONS=>3}
HBase数据结构
RowKey(行键)
ColumnFamily(列族)
TimeSteamp(时间戳)
NameSpace(命名空间)
Hbase读数据流程
1.获取meta表所在服务器节点(信息)
2.返回节点信息
3.查询rowkey数据在元数据数据表中信息
4.返回row数据所在节点信息
5.查询rowkey数据
5.1找到regionServer
5.2找到region分区
5.3找到列族(store)
5.4先查MemStore(写数据)里面的数据
5.5再查BlockCache(读数据)里面的数据
5.6再到HFile里面(有真正的数据)
5.7HFile里面读到数据后放到BlockCahe里面一份
5.8返回客户端查到的数据
返回查询的结果
HBase写数据流程
1.获取meta表(hbase:meta)所在服务器节点信息
3.找到regionServer
4.找到region(partition分区)(是根据rowke找的)
5.找到Store(列族)
6.往MemStore里面放一份,在Hlog(write ahead log)里面放一份
写数据流程
子主题
读数据流程