Redis05-Redis的数据结构之整数集合
前言
前面我们学习了Redis04-Redis的数据结构之跳表,跳表这种数据结构,这篇我文章我们来学习另外一种数据结构----整数集合。
整数集合的概念
当一个集合只包含整数值元素,并且这个集合的元素数量不多时,Redis就会使用整数集合作为集合键的底层实现,它可以保存的类型为int16_t、int32_t或者int64_t的整数值,集合中不允许有重复元素,Redis除了支持集合内的增删改查,同时还支持多个集合的交并集操作,合理地使用集合可以在实际开发中解决很多实际问题。
常用命令
集合内的操作
- 添加元素:
sadd key element[element ...]
,返回结果为添加成功的元素个数。 - 删除元素:
srem key element[element ...]
,返回结果为成功删除的元素个数。 - 计算元素个数:
scard key
,该命令的实际复杂度为O(1),不会遍历集合中所有元素,而是直接使用Redis的内部变量。 - 判断元素是否在集合中:
slsmember key element
,存在则返回1,否则返回0; - 随机从集合中返回指定个数的元素:
srandmember key[count]
; - 从集合随机弹出元素:
spop key
; - 获取全部元素:
smembers key
;
集合间操作
- 取交集:
sinter key [key ...]
- 取并集
sunion key [key ...]
- 取差集:
sdiff key [key ...]
整数集合的实现
整数集合(intset)是Redis用于保存整数值的集合抽象数据结构,它可以保存类型为int6_t、int32_t或者int64_t的整数值,并且保证集合中不会出现重复元素。
typedef struct intset {
// 编码方式
uint32_t encoding;
// 集合包含的元素数量
uint32_t length;
// 保存元素的数组
int8_t contents[];
} intset;
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
contents 数组时整数集合的底层实现,整数集合的每个元素都是contents数组的一个数组项(item),各个项在数组中按值的大小从小到大的有序排列,并且数组中不包括任何重复项。
length属性记录了整数集合包含的元素数量,也即是contents数组的长度。
虽然intset结构将contents属性声明为int8_t类型的数组,但实际上contents数组并不保存任何int8_t类型的值,contents数组的整数类型取决于encoding属性的值。
- 如果encoding属性的值INTSET_ENC_INT16,那么contents就是一个int16_t类型的数组,数组里的每个项都是一个int16_t类型的整数值(最少值为 -32768,最大值为 32767)。
- 如果encoding属性的值为INTSET_ENC_INT32,那么contents就是一个int32_t类型的数组,数组里的每个项都是一个int32_t类型的整数值(最小值为-2147483648,最大值为2147483647)。
- 如果encoding属性的值为INTSET_ENC_INT64,那么contents就是一个int64_t类型的数组,数组里的每个项都是一个int64_t类型的整数值(最小值为-9223372036854775808,最大值为9223372036854775807)。
举个例子
如上图所示,encoding属性的值为INTSET_ENC_INT16,表示整数集合的底层实现为int16类型的数组,而集合保存的都是int16_t类型的整数值。
length属性的值为5,表示整数集合包含五个元素。
content数组按从小到大的顺序保存着集合中的五个元素。
因为每个集合元素都是int16_t类型的整数值,所以contents数组的大小等于size of(int16_t) *5=80位
整数集合的升级
每当我们要将一个新元素添加到整数集合里面,并且新元素的类型比整数集合现有所有元素的类型都要长时,整数集合需要进行升级(upgrade),然后才能将新元素添加到整数集合里面。
升级整数集合并添加新元素共分为三步进行
- 根据新元素的类型,扩展整数集合数组的空间大小,并为新元素分配空间。
- 将底层数组现有的所有元素都转换成新元素相同的类型,并将类型转换后的元素放置在正确的位置上,而且在放置元素的过程中,需要继续维持底层数组的有序性不变。
- 将新元素添加到底层数组里面。
升级的好处
- 提升灵活性
因为整数集合可以通过自动升级底层数组类型适应新元素,所以我们可以随意地将int16_t、int32_t或int64_t类型的整数添加到集合中,而不必担心出现类型错误,这种做法非常灵活。 - 节约内存
要让一个数组可以同时保存int16_t、int32_t、int64_t三种类型的值,最简单的做法就是直接使用int64_t类型的数组作为整数集合的底层实现,不过这样一来,即使添加到整数集合里面的都是int16_t类型或者int32_t类型的值,数组都需要使用int64_t类型的空间去保存他们,从而出现了浪费内存的情况。
使用场景
集合类型典型的使用场景就是标签功能(tag),标签数据对用户体验以及增强用户粘度比较重要。
下面简单介绍如何使用集合类型实现标签功能的若干功能:
- 给用户添加标签
sadd user:1:tags tag1 tag2 tag3
sadd user:2:tags tag1 tag2 tag4
...
sadd user:3:tags tag1 tag2 tag5
- 1
- 2
- 3
- 4
- 给标签添加用户
sadd tag1:users user:1 user:2
sadd tag2:users user:1 user:3
...
sadd tag3:users user:1 user:4
- 1
- 2
- 3
- 4
- 删除用户下的标签
srem user:1:tags tag1 tag5
- 1
- 计算用户共同感兴趣的标签
sinter user:1:tags user:2:tags
- 1
总结
本文简单介绍了整数集合这种数据结构,整数集合是集合键的底层实现之一,是专门用来存储整数的,整数集合的底层实现是数组,这个数组以有序,无重复的方式保存集合元素,在有需要时,程序为会根据新添加元素的类型,改变这个数组的类型,升级操作为整数集合带来了操作上的灵活性,并且尽可能节约了内存。
文章来源: feige.blog.csdn.net,作者:码农飞哥,版权归原作者所有,如需转载,请联系作者。
原文链接:feige.blog.csdn.net/article/details/108568577
- 点赞
- 收藏
- 关注作者
评论(0)