沙龙晃荡 | 去哪儿、陌陌、ThoughtWorks在主动化运维中的实践!10.28不见不散!
HBase是一个构建在HDFS上的分布式列存储体系。HBase是Apache Hadoop生态体系中的重要一员,重要用于海量构造化数据存储;
Hbase表的特点
大年夜:一个表可以稀有十亿行,上百万列;
无模式:每行都有一个可佩序的主键和随便率性多的列,列可以根据须要动态的增长,同一张表中不合的行可以有截然不合的列;
大年夜逻辑上讲,HBase将数据按照表、行和列进行存储。两者都具有优胜的容错性和扩大性,都可以扩大到成百上千个节点;
面向列:面向列(族)的存储和权限控制,列(族)自力检索;
稀少:对于空(null)的列,并不占用存储空间,表可以设计的异常稀少;
数据多版本:每个单位中的数据可以有多个版本,默认情况下版本号主动分派,是单位格插入时的时光戳;
数据类型单一:Hbase中的数据都是字符串,没有类型。
Hbase数据模型
HBase是基于Google BigTable模型开辟的,典范的key/value体系;
Hbase逻辑视图
HBase schema可以有多个 Table,每个表可由多个Column Family构成。HBase可以有 Dynamic Column列名称是编码在cell中的,不合的cell可以拥有不合的列。
【编辑推荐】
- 云存储与安防密弗成分 市场潜力爆发期近
- 如安在数据中间应用混淆存储
- 冲破存储跨中间双活筹划设计阶段可贵之一:脑裂风险
- 云存储技巧解析:无存储 不智能
- 冲破存储跨中间双活筹划设计阶段可贵之二:机能影响
推荐阅读
沙龙晃荡 | 去哪儿、陌陌、ThoughtWorks在主动化运维中的实践!10.28不见不散! 大年夜讲台师长教师并不想说Spark和Hadoop谁强谁弱,而是想告诉大年夜家——在比较Hadoop和Spark>>>详细阅读
本文标题:分布式存储系统HBase的架构
地址:http://www.17bianji.com/lsqh/38035.html
1/2 1