分布式存储系统HBase的架构

沙龙晃荡 | 去哪儿、陌陌、ThoughtWorks在主动化运维中的实践！10.28不见不散！

HBase是一个构建在HDFS上的分布式列存储体系。HBase是Apache Hadoop生态体系中的重要一员，重要用于海量构造化数据存储;

Hbase表的特点

大年夜：一个表可以稀有十亿行，上百万列;

无模式：每行都有一个可佩序的主键和随便率性多的列，列可以根据须要动态的增长，同一张表中不合的行可以有截然不合的列;

大年夜逻辑上讲，HBase将数据按照表、行和列进行存储。两者都具有优胜的容错性和扩大性，都可以扩大到成百上千个节点;

面向列：面向列(族)的存储和权限控制，列(族)自力检索;

稀少：对于空(null)的列，并不占用存储空间，表可以设计的异常稀少;

数据多版本：每个单位中的数据可以有多个版本，默认情况下版本号主动分派，是单位格插入时的时光戳;

数据类型单一：Hbase中的数据都是字符串，没有类型。

Hbase数据模型

HBase是基于Google BigTable模型开辟的，典范的key/value体系;

Hbase逻辑视图

HBase schema可以有多个 Table，每个表可由多个Column Family构成。HBase可以有 Dynamic Column列名称是编码在cell中的，不合的cell可以拥有不合的列。

【编辑推荐】

【义务编辑：武晓燕 TEL：（010）68476606】

　　推荐阅读

　　大数据前景分析：Hadoop将被Spark替代？

沙龙晃荡 | 去哪儿、陌陌、ThoughtWorks在主动化运维中的实践！10.28不见不散！大年夜讲台师长教师并不想说Spark和Hadoop谁强谁弱，而是想告诉大年夜家——在比较Hadoop和Spark>>>详细阅读

地址：http://www.17bianji.com/lsqh/38035.html