图解Redis 04 | Set数据类型的原理及应用场景

devtools/2024/10/22 10:45:57/

介绍

Redis 的 Set 类型是一个不允许重复元素的集合,元素存储的顺序不按照插入的顺序,因此属于无序集合。一个 Set 最多可以存储 2^32 - 1 个元素,这与数学中的集合概念类似。Set 类型不仅支持增、删、改、查等操作,还支持多个Set之间的交集、并集和差集运算。

内部实现

Set 类型的底层数据结构可以通过哈希表或intset实现:

  • 如果集合中的所有元素都是整数,并且元素个数小于 512(默认值,可通过属性 set-maxintset-entries 配置),Redis 会使用intset作为 Set 类型的底层数据结构。
  • 如果集合中的元素不符合上述条件,Redis 会使用哈希表作为 Set 类型的底层数据结构。

常用命令

添加一个或多个元素。
sadd key member [member …]> sadd myset v1 v2 v3
(integer) 3integer) 3
查询集合中的所有元素。
smembers key127.0.0.1:6379> smembers myset 
1)“v1” 
2)“v3” 
3)“v2”
查询集合中成员的数量。
scard key> scard myset
(integer) 3integer) 3

命令:scard key

查询集合中是否包含某个元素。
sismember key member> sismember myset v1
(integer) 1integer) 1
> sismember myset v4
(integer) 0
将元素从一个集合移动到另一个集合。
smove source destination member> sadd myset2 v1 v8
(integer) 2integer) 2
> smembers myset2
1) "v1"
2) "v8"
> smove myset myset2 v3
(integer) 1
> smembers myset2
1) "v3"
2) "v1"
3) "v8"
> smembers myset
1) "v1"
2) "v2"
删除集合中的一个或多个元素。
srem key member [member …]> smembers myset2
1) "v3"
2) "v1"
3) "v8"
127.0.0.1:6379> srem myset2 v1
(integer) 1
> smembers myset2
1) "v3"
2) "v8"

注意:使用srem指令时,不存在的元素将被忽略。

返回一个或多个集合的交集。
sinter key [key …]> sadd myset3 v1 v2 v3
(integer) 33
> smembers myset3
1) "v3"
2) "v1"
3) "v2"
127.0.0.1:6379> smembers myset2
1) "v3"
2) "v8"
127.0.0.1:6379> sinter myset myset2
1) "v3"

更多操作命令,详见文章末尾部分。

应用场景

Set数据结构凭借其无序、不可重复的特性,以及支持并集、交集、差集等丰富操作,在多个场景中展现出卓越的价值。特别是在数据去重保证数据唯一性方面,Set 类型表现优异,除此之外,Set还适合用于统计多个集合之间的交集、并集和差集等关系。

当需要存储的数据不要求保持特定顺序,并且要求数据项唯一、不能重复时,Set 类型无疑是一个理想的选择。

然而,需要注意的是,虽然 Set 提供了强大的集合操作功能,但在处理大规模数据时,直接进行差集、并集、交集等操作的计算复杂度可能会比较高,从而可能导致 Redis 实例在处理过程中出现性能瓶颈或阻塞现象。

在主从集群架构中,为了避免主库因执行这些集合操作而导致的阻塞问题,建议采用以下策略之一

  1. 可以选择一个从库专门用于执行这些聚合计算任务,从而减轻主库的负担;
  2. 可以将原始数据返回给客户端,让客户端负责相关的聚合统计计算。

这两种方式都可以有效避免主库因计算复杂度高而带来的性能问题。

关于主从集群架构的更多细节,我会在后续的文章中进行介绍,这里先留个印象就好了。

场景一:文章点赞

以下是一个示例场景:假设我们有一个文章 ID 为 article:1 的文章。为了记录用户对这篇文章的点赞情况,使用 Set 类型,key为文章 ID article:1,而 Set 中的每个元素代表一个用户 ID。

Set 类型其元素的不可重复性可以确保一个用户只能对某篇文章点赞一次。因此Set 中有多少个元素就代表了有多少个用户对文章点赞了。

例如,用户 uid:1、uid:2 分别对文章 article:1 进行了点赞。这时,article:1 对应的 Set 中将包含这2位用户的 ID:

> SADD article:1 uid:100001
(integer) 1> SADD article:1 uid:100002
(integer) 1
获取喜欢article:1文章的用户数:
> SCARD article:1
(integer) 2
获取所有喜欢article:1文章的用户。
> SMEMBERS article:1
1) "uid:100002"
2) "uid:100001"
判断用户是否uid: 100002喜欢该篇文章.
> SISMEMBER article:1 uid:100002
(integer) 1  
用户uid:100001取消对article:1文章点赞
> SREM article:1 uid:100001
(integer) 1

场景二:共同关注的好友

Set 类型支持交集运算,因此可以用来计算多个用户关注的共同对象,例如共同关注的好友或博主。

假设我们有两个用户和他们关注的博主账号信息:

  • 用户 uid:1 关注了账号 ID 为 7、8、9。
  • 用户 uid:2 关注了账号 ID 为 8、9、10。
> SADD uid:1 7 8 9
(integer) 3> SADD uid:2 8 9 10
(integer) 3
uid:1uid:2共同关注的博主集合
> SINTER uid:1 uid:2
1) "8"
2) "9"

Set类型与List类型的区别

最后,我们来看看 Set 类型和 List 类型的一些主要区别:

Set 类型:

  • 元素无序且不重复:Set 中的元素不按照任何特定顺序存储,并且每个元素在集合中是唯一的,不允许重复。
  • 主要用途:适用于快速判断集合中某个元素是否存在,计算集合的交集、并集、差集等操作。
  • 适用场景:适合存储具有唯一标识符且不关心顺序的元素集,例如标签集或用户的唯一 ID 列表。

List 类型:

  • 元素有序可以重复:List 中的元素按照插入的顺序存储,可以通过索引访问每个元素。
  • 支持操作:支持在头部或尾部添加、删除元素等操作。
  • 常见用途:常用于实现队列、栈等数据结构,按顺序存储一系列相关元素,例如消息队列或任务列表。

更多集合操作命令

移除并返回集合中的一个随机元素。
spop key [count]> smembers myset
1) "v1"
2) "v2"
> spop myset 1
1) "v1"
> smembers myset
1) "v2"
随机返回集合中指定数量的元素列表。
srandmember key [count]> sadd myset v2 v3 v4
(integer) 3
> srandmember myset 2
1) "v2"
2) "v4"
将集合的交集复制到新集合。
sinterstore destination key [key …]127.0.0.1:6379> smembers myset
1) "v3"
2) "v4"
3) "v2"
127.0.0.1:6379> smembers myset2
1) "v3"
2) "v8"
127.0.0.1:6379> sinterstore myset4 myset myset2
(integer) 1
127.0.0.1:6379> smembers myset4
1) "v3"

需要注意的是将集合 myset 和集合 myset2 的并集元素(如 v3)复制到了新集合 myset4 中。而v3 等元素依然保留在原始集合中,不会被删除。

查询一个或多个集合的并集。
sunion key [key …]127.0.0.1:6379> smembers group1
1) "java"
127.0.0.1:6379> smembers group2
1) "golang"
127.0.0.1:6379> sunion group1 group2
1) "java"
2) "golang"
将一个或多个集合的并集复制到一个新集合。
sunionstore destination key [key …]127.0.0.1:6379> smembers group1
1) "java"
127.0.0.1:6379> smembers group2
1) "golang"
127.0.0.1:6379> sunionstore group3 group1 group2
(integer) 2
127.0.0.1:6379> smembers group3
1) "java"
2) "golang"

需要注意的是该命令只会多个集合的并集元素复制到一个新集合,被复制的元素不会从原始集合中删除。

查询多个集合的差异集。
sdiff key [key …]127.0.0.1:6379> smembers group1
1) "java"
2) "golang"
127.0.0.1:6379> smembers group2
1) "golang"
127.0.0.1:6379> sdiff group1 group2
1) "java"
将多个集合的差异集复制到一个新集合。
sdiffstore destination key [key …]127.0.0.1:6379> smembers group1
1) "java"
2) "golang"
127.0.0.1:6379> smembers group2
1) "golang"
127.0.0.1:6379> sdiffstore group3 group1 group2
(integer) 1
127.0.0.1:6379> smembers group3
1) "java"

http://www.ppmy.cn/devtools/125753.html

相关文章

闲说视频清晰度和各种格式、编码技术的发展历史

文章目录 引子清晰度视频格式:MP4、AVI 、MKV、MOV、WMV、FLV 、RMVB等等什么是视频格式MP4AVIMKVMOVWMVFLVRM / RMVB其他 编码技术:MPEG-1、MPEG-2、MPEG-4、RealVideo、DivX、XviD、H.264(AVC)、H.265(HEVC&#xff…

pnpm报错 cannot find package xxx,有的电脑正常运行,只有这个的电脑报错

pnpm build报错 cannot find package xxx,有的电脑正常运行,只有这一个报错 在网上查找各种资料发现是项目在电脑里的目录层级比较深导致的。 问题:在 Windows 系统上,文件路径过长(超过 260 个字符)可能…

工程需要用到物资管理吗?

建筑工程在日常作业中离不开钢筋、混凝土等物资,这些物资在工程项目中占据着至关重要的地位,能够直接影响到工程项目的成本、质量和进度。 项目想要提高效率就避不开使用物资管理系统,那么物资管理包括哪些管理呢? 工程物资管理…

VSCode运行QT界面

VSCode用久了,感觉Qt Creator的写起代码来还是不如VSCode得心应手,虽然目前还是存在一些问题,先把目前实现的状况做个记录,后续有机会再进一步优化。 当前方式 通过QtCreator创建一个CMake项目,然后使用CMake的方式在VSCode中进行编译。 claude给出的建议 左上角的名字会…

SpringBoot智能推荐:健康生活新体验

4系统概要设计 4.1概述 本系统采用B/S结构(Browser/Server,浏览器/服务器结构)和基于Web服务两种模式,是一个适用于Internet环境下的模型结构。只要用户能连上Internet,便可以在任何时间、任何地点使用。系统工作原理图如图4-1所示: 图4-1系统工作原理…

科大讯飞C++开发一面-面经总结

1、内存泄漏和内存溢出的概念? 内存泄漏定义:内存泄漏是指程序在动态分配内存后,失去了对该内存的引用,但该内存并没有被释放。也就是说,程序无法再访问这块内存区域,导致这部分内存被“遗忘”而无法被回收…

如何配置 Nginx:从入门到进阶

Nginx 是一款高性能的开源 Web 服务器,也可以用作反向代理、负载均衡器和 HTTP 缓存。由于其轻量级和高效的设计,Nginx 被广泛用于处理高并发连接场景。在这篇博客中,我将介绍 Nginx 的基本配置,并分享一些常见的实用配置技巧&…

视频的编解码格式

文章目录 视频的编解码格式概念术语视频处理流程视频封装格式视频编码格式视频编解码器,视频容器和视频文件格式之间的区别补充视频码率 参考资料 视频的编解码格式 概念术语 两大组织主导视频压缩的组织及其联合(joint)组织 ITU-T(VCEG) ITU-T的中文名称是国际电信…