Redis高级数据类型Hyperloglog、Bitmap快速带你上手!!!
前言
很多小伙伴在面试中都会被问道 Redis的常用数据结构有哪些?
可能很大一部分回答都是 string、hash、list、set、zset。当然啦,这个答案肯定是没有错的,但是相信这个答案,面试官已经听的耳朵都起茧了。
本身我们选择的这个行业竞争就极强,学历拼不过难道还要知识都拼不过吗???
希望进来的小伙伴能好好看完这篇文章,也希望你以后的回答能是 常用的数据结构有string、hash、list、set、zset,但我平时可能还会用到 Hyperloglog和Bitmap。相信面试官听到你的回答,会有眼前一亮的感觉!
话不多说,开始吧,⬇
Hyperloglog
Hyperloglog简介
HyperLogLog是一种概率数据结构,用来估算数据的基数。
基数:可简单理解为集合中不同元素的个数,也可以理解为Set
对于一个集合 1、2、3、4,那么它的基数为 4
对于一个集合 1、2、3、4、1,那么它的基数也是 4
Hyperloglog作用
我们可以使用它来统计 UV。
UV即:UniqueVisitor,UV指的是==独立访客的数量==,一台电脑被视为一个独立访客。一台电脑早上访问了一次,下午又访问了一次,两次访问的都是同一个网站,只能被计算一次。
那可能有小伙伴问了,及刚才都说了可以理解为一个Set,那我为什么要用它来统计UV?
Redis 的 HyperLogLog 通过牺牲准确率来减少内存空间的消耗,只需要12K内存,在标准误差0.81%的前提下,能够统计2^64个数据。而Set就需要消耗大量空间
所以 HyperLogLog 是否适合在比如统计区间活跃度这样对精度要求不高的场景。
为什么能这么存储,主要依赖于伯努利试验,各位小伙伴可以去百度了解了解。
命令行中的使用
- pfadd <key> [element]:添加数据
- pfcount <key>:统计数量
SpringBoot中的使用
@Test
public void testHyperloglog() {
String key = "language";
for (int i = 1; i <= 10000; i++) {
redisTemplate.opsForHyperLogLog().add(key,i);
}
for (int i = 5000; i <= 15000; i++) {
redisTemplate.opsForHyperLogLog().add(key,i);
}
for (int i = 10000; i <= 20000; i++) {
redisTemplate.opsForHyperLogLog().add(key,i);
}
long size = redisTemplate.opsForHyperLogLog().size(key);
System.out.println(size);
}
可以看到结果值为:19891与真实值:20000相差不了多少,虽说有误差,但相比于set已经是很好了!
除此之外,在SpringBoot中还可以对多个key进行合并,统计合并之后的数据量
@Test
public void testHyperloglog() {
String key1 = "language1";
String key2 = "language2";
String key3 = "language3";
String unionKey = "language";
for (int i = 1; i <= 10000; i++) {
redisTemplate.opsForHyperLogLog().add(key1,i);
}
for (int i = 5000; i <= 15000; i++) {
redisTemplate.opsForHyperLogLog().add(key2,i);
}
for (int i = 10000; i <= 20000; i++) {
redisTemplate.opsForHyperLogLog().add(key3,i);
}
redisTemplate.opsForHyperLogLog().union(unionKey,key1,key2,key3);
long size = redisTemplate.opsForHyperLogLog().size(unionKey);
System.out.println(size);
}
可见,数据还是19891
Bitmap
Bitmap简介
位图不是特殊的数据结构,它其实就是普通的字符串,也就是 byte 数组(有了解布隆过滤器的小伙伴可展开联想一下)
通过一个bit位来表示某个元素对应的值或者状态,其中的key就是对应元素本身。
位操作分为两组:
- 固定时间的单个位操作(如将一个位设置为1或0或获取其值)
- 对位组的操作,例如计算给定位范围内设置的位的数量(例如,人口计数)。
位图的最大优点之一是,在存储信息时,它们通常可以节省大量空间。例如,在以增量用户ID表示不同用户的系统中,仅使用512 MB内存就可以记住40亿用户的一位信息
Bitmap作用
使用场景
- 各种实时分析。
- 存储与对象ID相关联的空间高效但高性能的布尔信息。
我们可以使用它来统计 DAU。
==日均活跃用户数量==(Daily Active User,DAU)是用于反映网站、互联网应用或网络游戏的运营情况的统计指标。日活跃用户数量通常统计一日(统计日)之内,登录或使用了某个产品的用户数(去除重复登录的用户)。
命令行使用Bitmap
使用 setbit 和 getbit 命令设置和检索位:
- setbit命令将位号作为其第一个参数,将其设置为1或0的值作为其第二个参数。如果所寻址的位超出当前字符串长度,则该命令将自动放大字符串。
- getbit 只是返回指定索引处的位的值。超出范围的位(寻址超出存储在目标键中的字符串长度的位)始终被视为零。
在位组上还有以下三个命令:
- bitop 在不同的字符串之间执行按位运算。提供的运算为AND,OR,XOR和NOT。
- bitcount 执行填充计数,报告设置为1的位数。
- bitpos 查找具有指定值0或1的第一位。
SpringBoot使用Bitmap
@Test
public void testBitmap() {
String key = "bitmap";
redisTemplate.opsForValue().setBit(key,1,true);
redisTemplate.opsForValue().setBit(key,4,true);
redisTemplate.opsForValue().setBit(key,2,true);
redisTemplate.opsForValue().setBit(key,5,true);
System.out.println(redisTemplate.opsForValue().getBit(key,2));
System.out.println(redisTemplate.opsForValue().getBit(key,3));
System.out.println(redisTemplate.opsForValue().getBit(key,5));
}
尾言
我是 Code皮皮虾,一个热爱分享知识的 皮皮虾爱好者,未来的日子里会不断更新出对大家有益的博文,期待大家的关注!!!
创作不易,如果这篇博文对各位有帮助,希望各位小伙伴可以 点赞和关注我哦,感谢支持,我们下次再见~~~
分享大纲
关注公众号,更多精彩内容尽在其中!!!
- 点赞
- 收藏
- 关注作者
评论(0)