HBase基础概念-Region, HRegionServer, HMaster
• HBase是一个分布式的KeyValue类型的NoSQL数据库. 每条记录都以KeyValue的形式被保存在HBase中, 即每一条记录都包含一个主键,这个主键在HBase中被称作RowKey. 所有的KeyValue按照RowKey的字典顺序被保存在HBase中.
• HBase集群中有两类节点:HMaster和HRegionServer. HMaster是管理节点,HRegionServer是Slave节点.
• 表被横向切割成了多个子表来实现分布式存储.这些子表在HBase中称作Region(每一个Region都可以说是一个具有起始Key和结束Key的区间).
• 每一个Region作为负载均衡的最小单元,会被分配在一个且只能分配到一个集群节点上被管理.这个集群节点就是RegionServer.
• 如果一个RegionServer进程因出现了意外无法继续对外提供服务的话,这个RegionServer上面所管理的所有的Region,会被转移到其它RegionServer上面. 这个转移的操作,由HMaster节点来完成.
• 写数据的时候(KeyValue由用户创建生成),首先判断这条数据属于哪个Region区间,而后,再判断这个Region属于哪个RegionServer, 然后这条数据就会被写往这个RegionServer的这个Region中.
• 当一个Region的大小超过一定的限制后,就会自动分裂成两个Region.
• 用户在按照RowKey来查询数据的时候,HBase可以快速的返回用户想要的数据. 这个响应时间几乎不会随着用户数据量的增加而受到任何的影响.
- 点赞
- 收藏
- 关注作者
评论(0)