Hbase数据库

举报
冬晨夕阳 发表于 2022/03/30 00:19:58 2022/03/30
【摘要】 海量数据存储解决方案:Hbase数据库解析 HBase是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系...

海量数据存储解决方案:Hbase数据库解析

HBase是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang
所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类似于Bigtable的能力。HBase是Apache的Hadoop项目的子项目。HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。另一个不同的是HBase基于列的而不是基于行的模式。

HBase的应用场景及特点
交通
金融
电商
移动(电话信息)等

Hbase表结构与架构详解

介绍:基于HDFS,面向列,nosql

基于HDFS:
HDFS:hadoop distributed file system:分布式文件系统:多台服务器组成的服务器集群组成的一个文件系统。

面向列:
表结构中的列是可以动态添加的。

架构图:分布式,主从架构
在这里插入图片描述

zookeeper:
职责:
1:保证任何时候,集群中只有一个Master
2: 实时监控RegionServer的上线和下线信息,并且实时通知master
3: 存储着region的寻址入口
Hmaster:
职责:
1:为regionserver分配region
2:发现了失效了regionserver,并且重新分配其上的region
3: 为regionserver做负载均衡
RegionServer:
职责:
1:regionserver负责维护region,处理对这些region的IO请求
2:regionserver负责在运行过程当中变得过大的region

搭建环境:
HDFS+Hbase

表结构:
在这里插入图片描述

列族:列的集合,它是表模式不能修改的。
列:一定要归属于某一个列族,列可以动态的添加
行键:rowkey
确定这一行数据的唯一标识 特点: 1 按照字典顺序排序
2 只能存储64k的数据

单元格:行键+列
时间戳:区分一个单元格里面的多份数据,默认使用系统时间。

Hbase数据库的操作

shell命令行:
list:列出所欲表
create “表名”,“列族”,“多个列族”
put “表名”,“行键”,“列族:列”,“值”
get “表名”,“行键”
disable 表名 drop 表名 删除表
scan:查询全名
sqoop:数据传输

文章来源: blog.csdn.net,作者:考古学家lx,版权归原作者所有,如需转载,请联系作者。

原文链接:blog.csdn.net/weixin_43582101/article/details/89193582

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。