hbase rowkey 如何设计和 hbase如何优化

举报
tscswcn 发表于 2019/03/16 22:29:08 2019/03/16
【摘要】 rowkey 如何设计hbase(main):001:0> create 'user_pp','info','partition',SPLITS => ['201','202','203','204']0 row(s) in 2.7700 seconds[rd@bxzj-test-swift0.bxzj.baixinlocal.com ~]$ cat 1a1b2c3d4e5hbase(mai...

rowkey 如何设计


hbase(main):001:0> create 'user_pp','info','partition',SPLITS => ['201','202','203','204']

0 row(s) in 2.7700 seconds


[rd@bxzj-test-swift0.bxzj.baixinlocal.com ~]$ cat 1

a1

b2

c3

d4

e5




hbase(main):002:0>  create 'user_pp1','info','partition',SPLITS_FILE => '1'

0 row(s) in 3.0460 seconds


=> Hbase::Table - user_pp1

hbase(main):003:0>

 

 



rowkey是数据的唯一标识,这条数据存储在 哪个分区由预

分区分为决定的


合理设计rowkey 


1份数据分为 5个 region 存储

但是我们需要尽可能的保持每个region 中的额数据量差不多



尽可能的大三数据,平均分配到每个region 中即可 


解决方案:

生成随机数,hash/散列值 

201

202。。



字符串拼接

20190316_a3d4



反转 字符串

201903161 -> 161309102

201903162 ->



001 hunter henshuai

002 Dekireba beafuil

003

004




HBASE 基础优化



datande 允许最大文件打开数 

默认 4096  调大 

dfs.datanode.max.transfer.threads

hdfs-site.xml




优化等待时间

dfs.image.transfer.timeout 60000  毫秒

调大 




内存优化  

hadoop-env.sh  设置内存的堆大小 

export HADOOP_PORT_OPTS='-Xmx512m '




【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。