Redis05-Redis的数据结构之整数集合

举报
码农飞哥 发表于 2021/05/29 11:37:26 2021/05/29
【摘要】 前言 前面我们学习了Redis04-Redis的数据结构之跳表,跳表这种数据结构,这篇我文章我们来学习另外一种数据结构----整数集合。 整数集合的概念 当一个集合只包含整数值元素,并且这个集合的元素数量不多时,Redis就会使用整数集合作为集合键的底层实现,它可以保存的类型为int16_t、int32_t或者int64_t的整数值,集合中不允许有重复元素,Red...

前言

前面我们学习了Redis04-Redis的数据结构之跳表,跳表这种数据结构,这篇我文章我们来学习另外一种数据结构----整数集合。

整数集合的概念

当一个集合只包含整数值元素,并且这个集合的元素数量不多时,Redis就会使用整数集合作为集合键的底层实现,它可以保存的类型为int16_t、int32_t或者int64_t的整数值,集合中不允许有重复元素,Redis除了支持集合内的增删改查,同时还支持多个集合的交并集操作,合理地使用集合可以在实际开发中解决很多实际问题。

常用命令

集合内的操作

  • 添加元素: sadd key element[element ...],返回结果为添加成功的元素个数。
  • 删除元素: srem key element[element ...],返回结果为成功删除的元素个数。
  • 计算元素个数:scard key,该命令的实际复杂度为O(1),不会遍历集合中所有元素,而是直接使用Redis的内部变量。
  • 判断元素是否在集合中:slsmember key element,存在则返回1,否则返回0;
  • 随机从集合中返回指定个数的元素:srandmember key[count]
  • 从集合随机弹出元素:spop key
  • 获取全部元素: smembers key;

集合间操作

  • 取交集: sinter key [key ...]
  • 取并集 sunion key [key ...]
  • 取差集: sdiff key [key ...]

整数集合的实现

整数集合(intset)是Redis用于保存整数值的集合抽象数据结构,它可以保存类型为int6_t、int32_t或者int64_t的整数值,并且保证集合中不会出现重复元素。

	typedef struct intset {
	// 编码方式
	uint32_t encoding;
	// 集合包含的元素数量
	uint32_t length;
	// 保存元素的数组
	int8_t contents[];
	} intset;

  
 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8

contents 数组时整数集合的底层实现,整数集合的每个元素都是contents数组的一个数组项(item),各个项在数组中按值的大小从小到大的有序排列,并且数组中不包括任何重复项。
length属性记录了整数集合包含的元素数量,也即是contents数组的长度。
虽然intset结构将contents属性声明为int8_t类型的数组,但实际上contents数组并不保存任何int8_t类型的值,contents数组的整数类型取决于encoding属性的值。

  • 如果encoding属性的值INTSET_ENC_INT16,那么contents就是一个int16_t类型的数组,数组里的每个项都是一个int16_t类型的整数值(最少值为 -32768,最大值为 32767)。
  • 如果encoding属性的值为INTSET_ENC_INT32,那么contents就是一个int32_t类型的数组,数组里的每个项都是一个int32_t类型的整数值(最小值为-2147483648,最大值为2147483647)。
  • 如果encoding属性的值为INTSET_ENC_INT64,那么contents就是一个int64_t类型的数组,数组里的每个项都是一个int64_t类型的整数值(最小值为-9223372036854775808,最大值为9223372036854775807)。

举个例子

在这里插入图片描述

如上图所示,encoding属性的值为INTSET_ENC_INT16,表示整数集合的底层实现为int16类型的数组,而集合保存的都是int16_t类型的整数值。
length属性的值为5,表示整数集合包含五个元素。
content数组按从小到大的顺序保存着集合中的五个元素。
因为每个集合元素都是int16_t类型的整数值,所以contents数组的大小等于size of(int16_t) *5=80位

整数集合的升级

每当我们要将一个新元素添加到整数集合里面,并且新元素的类型比整数集合现有所有元素的类型都要长时,整数集合需要进行升级(upgrade),然后才能将新元素添加到整数集合里面。

升级整数集合并添加新元素共分为三步进行

  1. 根据新元素的类型,扩展整数集合数组的空间大小,并为新元素分配空间。
  2. 将底层数组现有的所有元素都转换成新元素相同的类型,并将类型转换后的元素放置在正确的位置上,而且在放置元素的过程中,需要继续维持底层数组的有序性不变。
  3. 将新元素添加到底层数组里面。

升级的好处

  1. 提升灵活性
    因为整数集合可以通过自动升级底层数组类型适应新元素,所以我们可以随意地将int16_t、int32_t或int64_t类型的整数添加到集合中,而不必担心出现类型错误,这种做法非常灵活。
  2. 节约内存
    要让一个数组可以同时保存int16_t、int32_t、int64_t三种类型的值,最简单的做法就是直接使用int64_t类型的数组作为整数集合的底层实现,不过这样一来,即使添加到整数集合里面的都是int16_t类型或者int32_t类型的值,数组都需要使用int64_t类型的空间去保存他们,从而出现了浪费内存的情况。

使用场景

集合类型典型的使用场景就是标签功能(tag),标签数据对用户体验以及增强用户粘度比较重要。
下面简单介绍如何使用集合类型实现标签功能的若干功能:

  1. 给用户添加标签
sadd user:1:tags tag1 tag2 tag3
sadd user:2:tags tag1 tag2 tag4
...
sadd user:3:tags tag1 tag2 tag5

  
 
  • 1
  • 2
  • 3
  • 4
  1. 给标签添加用户
sadd tag1:users user:1 user:2
sadd tag2:users user:1 user:3
...
sadd tag3:users user:1 user:4

  
 
  • 1
  • 2
  • 3
  • 4
  1. 删除用户下的标签
 srem  user:1:tags  tag1  tag5

  
 
  • 1
  1. 计算用户共同感兴趣的标签
 sinter user:1:tags user:2:tags

  
 
  • 1

总结

本文简单介绍了整数集合这种数据结构,整数集合是集合键的底层实现之一,是专门用来存储整数的,整数集合的底层实现是数组,这个数组以有序,无重复的方式保存集合元素,在有需要时,程序为会根据新添加元素的类型,改变这个数组的类型,升级操作为整数集合带来了操作上的灵活性,并且尽可能节约了内存。

文章来源: feige.blog.csdn.net,作者:码农飞哥,版权归原作者所有,如需转载,请联系作者。

原文链接:feige.blog.csdn.net/article/details/108568577

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。