Redis 7.x 系列【11】数据类型之位图(Bitmap)

devtools/2024/10/18 23:23:47/

有道无术,术尚可求,有术无道,止于术。

本系列Redis 版本 7.2.5

源码地址:https://gitee.com/pearl-organization/study-redis-demo

文章目录

    • 1. 概述
    • 2. 基本命令
      • 2.1 SETBIT
      • 2.2 GETBIT
      • 2.3 BITCOUNT
      • 2.4 BITPOS
      • 2.5 BITFIELD
      • 2.6 BITFIELD_RO
      • 2.7 BITOP
    • 3. 应用场景
      • 3.1 用户登录状态
      • 3.2 签到打卡

1. 概述

Redis Bitmap 实际不是一个独立的数据类型,而是基于 String 类型实现的。它主要用于存储二值状态(即集合元素的取值只有 01 两种)。由于每个位只能表示两种状态,在需要快速进行大量数据的排序、查找、去重等操作时具有显著优势。

Bitmap 实际上是利用 String 类型的最大容量(512 MB)存储一个连续的二进制序列。每个字节的 8 位可以分别代表 8 个独立的状态,因此可以用一个 Bitmap 来跟踪多达数百万甚至数十亿的状态。

2. 基本命令

所有命令:

命名描述
BITCOUNT统计给定范围内为1的位的数量
BITFIELD对字符串类型的 key 进行基于位的操作
BITFIELD_RO使用 BITFIELD命令进行只读操作
BITOP执行针对多个 Bitmap 的并集、交集、差集等位操作
BITPOS查找指定位值的第一个位置
GETBIT获取指定偏移量处的位状态
SETBIT设置指定偏移量处的位状态

2.1 SETBIT

SETBIT 命令用于对 key 所储存的字符串值,设置或清除指定偏移量上的位(bit)。时间复杂度为 O(1),因为直接在内存中操作字符串的位表示。返回值为存储在指定偏移量处的原始位值(01)。

基本语法:

SETBIT key offset value

参数说明:

  • key:操作的 key
  • offset:指定偏移量,从 0 开始计数。注意,偏移量必须大于或等于 0 ,且小于 2^32
  • value:设置的值,只能是 01

注意事项:

  • 如果key不存在,会自动为其创建一个新的字符串。
  • 如果设置的偏移量超过了字符串的当前长度,会扩展字符串以确保可以在指定的偏移量处设置值。扩展部分会使用 0 填充。
  • 警告操作:当key 不存在,或者是比较小的字符串时,直接设置 2^32-1 位置时,会立即分配所有内存,这有可能会导致服务阻塞

示例:

# 想设置其偏移量为7的位为1
SETBIT mykey 7 1

2.2 GETBIT

GETBIT 命令是用于获取存储在 key 中的字符串值在指定偏移量上的位(bit)值的操作。返回值是一个整数,表示指定偏移量上的位的值。返回值只可能是 01

基本语法:

GETBIT key offset

示例:

# 获取偏移量为7的位的值
GETBIT mykey 7

2.3 BITCOUNT

BITCOUNT 命令用于统计指定 key 所储存的字符串值中,被设置为1的二进制位的数量。

基本语法:

BITCOUNT key [start] [end]

参数说明:

  • key:要统计的 key ,对应的值应该是一个字符串。
  • start(可选):统计二进制位的开始位置,参数类型为整数,默认从0开始统计。
  • end(可选):统计二进制位的结束位置,参数类型为整数,默认统计到整个字符串的末尾。

注意事项:

  • 如果指定的 key 不存在,会将其视为空字符串,因此返回值为 0
  • 时间复杂度为 O(N),其中N是字符串的长度(以字节为单位)。在处理大数据量时,请注意性能问题。

无参示例:

redis> SET mykey "foobar"  
OK  
redis> BITCOUNT mykey  
(integer) 26

带参示例:

redis> SET mykey "\xff\xf0\x00"  
OK  
redis> BITCOUNT mykey 0 7  
(integer) 12  
redis> BITCOUNT mykey 0 0 4  
(integer) 4  
redis> BITCOUNT mykey 1 1 4  
(integer) 6

2.4 BITPOS

BITPOS 命令用于查找字符串中第一个设置为指定值(01)的 bit 位,并返回该位置。如果没有找到匹配的 bit,则返回-1

基本语法:

BITPOS key bit [start] [end]

参数说明:

  • key:要操作的 key,其值应为一个字符串。
  • bit:要查找的 bit 值,只能是 01
  • start(可选):开始查找的起始位置,默认为 0
  • end(可选):结束查找的位置,默认为 -1 ,表示字符串的最后一个 bit

注意事项:

  • 如果指定的 key 不存在,会将其视为一个空字符串,并查找空字符串中的 bit
  • 如果在指定的范围内没有找到匹配的 bit,则返回 -1
  • 查找范围是基于 bit 的,而不是基于字节的。例如,start=0end=7 表示查找前 8bit,而不是第一个字节。
  • 命令的时间复杂度为 O(N) ,其中 N 是字符串的长度(以 bit 为单位)。在处理大数据量时,请注意性能问题。

假设当前对应的字符串值为"\xff\x00\x00",这是一个二进制字符串的十六进制表示,"\xff"代表8个连续的1"\x00"代表8个连续的0

查找第一个为1bit

BITPOS mykey 1  
(integer) 0

查找第一个为0bit

BITPOS mykey 0 8  
(integer) -1  
BITPOS mykey 0 9  
(integer) 9

2.5 BITFIELD

BITFIELD 允许将 Redis 字符串视为一个位数组,并允许用户对其中的位进行操作,如获取、设置和递增等。对于每个子命令,BITFIELD都会返回一个响应数组,其中每个数组元素都与参数列表中的相应操作相匹配。

基本语法:

BITFIELD key [GET type offset] [SET type offset value] [INCRBY type offset increment] [OVERFLOW wrap|sat|fail]

参数说明:

  • key:要操作的Redis键。
  • GET:用于从字符串中获取指定位置的位域值。
  • SET:用于设置字符串中指定位置的位域值。
  • INCRBY:用于将字符串中指定位置的位域值进行增加。
  • OVERFLOW:用于指定溢出处理方式,可选值有 wrap(回绕)、sat(饱和)和fail(失败)。

子命令GET参数说明:

  • type:指定读取数据的类型,可以是u(无符号整数)或 i(有符号整数)。
  • offset:位字段的起始偏移位置,从0开始计数。

子命令SET参数说明:

  • type:类型标识,可以是u(无符号整数)或 i(有符号整数)。
  • offset:位字段的起始偏移位置。
  • value:要设置的位域值。

子命令INCRBY参数说明:

  • type:指定要递增的数据类型。
  • offset:位字段的起始偏移位置。
  • increment:递增的值。

OVERFLOW用于指定溢出处理方式,参数说明:

  • wrap:使用回绕方法处理溢出,位域超过最大值后再次增加数值则回到最小值。
  • sat:饱和计算,超过最大值再增加则数值仍不变。
  • fail:超过最大值再增加,则命令直接报错,拒绝指定。

注意事项:

  • 可以在同一个命令调用中使用多个子命令,并按照给定的顺序执行它们。
  • 命令的时间复杂度为O(1),用于指定的每个子命令。
  • 使用BITFIELD命令时,请确保对二进制位操作有深入的理解,以避免出现意外的结果。

示例,假设有一个 key 其对应的字符串值为"abcd"(其ASCII码值分别为97, 98, 99, 100)。获取第一个字符的 ASCII 码值(无符号8位整数):

BITFIELD mykey GET u8 0

修改第二个字符的ASCII码值为大写'B'ASCII码值为66):

BITFIELD mykey SET u8 8 66

将第三个字符的ASCII码值增加1'c'变为'd'):

BITFIELD mykey INCRBY u8 16 1

2.6 BITFIELD_RO

BITFIELD_RO 命令作为 BITFIELD 命令的只读变体。这个命令允许用户从二进制位图中安全地读取数据,而不需要担心在只读副本上执行写操作。

基本语法:

BITFIELD_RO key [GET encoding offset [GET encoding offset ...]]

参数说明:

  • key: 要操作的二进制位图的键名。
  • GET: 表示读取操作。
  • encoding: 指定要读取的数据的编码类型(如 u8i8u16i16u32i32u64i64f32f64)。
  • offset: 指示在二进制位图中的起始位置(以位为单位)。

注意事项:

  • 由于原始的 BITFIELD 命令包含 SETINCRBY 等写操作选项,因此它在 Redis 命令表中被标记为写命令。这意味着在 Redis 集群的只读副本上,即使连接处于只读模式,该命令也会被重定向到主实例。
  • 为了在只读副本上允许 BITFIELD 行为而不破坏命令标志的兼容性,Redis 6.2 引入了 BITFIELD_RO 变体。
  • 通过使用 BITFIELD_RO,可以在只读副本上安全地执行读取操作,而无需担心数据的不一致性或其他与写操作相关的问题

示例,假设有一个名为 hello 的二进制位图,并且我们想要从第 16 位开始读取一个 8 位有符号整数(i8):

BITFIELD_RO hello GET i8 16

2.7 BITOP

BITOP 命令用于对多个键(包含字符串值)执行位操作,并将结果存储在目标键中。它支持四种位操作:AND(与)、OR(或)、XOR(异或)和 NOT(非)。NOT 操作是特殊的,因为它只接受一个输入键,因为位反转只作为一元运算符才有意义。

基本语法:

BITOP <AND | OR | XOR | NOT> destkey key [key ...]

参数说明:

  • <AND | OR | XOR | NOT>:要执行的位操作类型。
  • destkey:存储操作结果的目标键。
  • key [key ...]:要参与位操作的键列表。对于 NOT 操作,只需要一个键。

示例:

redis> SET key1 "foobar"  
"OK"  
redis> SET key2 "abcdef"  
"OK"  
redis> BITOP AND dest key1 key2  
(integer) 6  
redis> GET dest  
"`bc`ab"

3. 应用场景

Bitmap 以极小的空间存储大量数据,2^32次方(约40亿)数据只需要约 500MB 内存,并提供了快速的查询和统计功能。Redis Bitmap的应用场景广泛,尤其在处理大量二进制数据或需要快速进行二值状态统计的场合下表现出色。

二值状态统计是指在集合中,元素的取值只有 01 两种状态,在实际开发中,经常会遇到签到/未签到登录/未登录等情况。

常用场景:

  • 签到打卡:每个用户每天的签到情况可以用一个 bit 位表示,签到为1未签到为0
  • 限制IP地址访问频率:每个 IP 地址对应 Bitmap 的一个 bit 位,访问时设置该位为1。判断某个 IP 地址是否已经访问过,并据此限制其访问频率。
  • 用户登录状态:可以使用 bit 位来记录用户的登录状态, 1 表示已登录,0 表示未登录。

3.1 用户登录状态

例如,当天 ID0-3的用户进行了登录:

localhost:0>SETBIT login_status:20240624 0 1
"0"
localhost:0>SETBIT login_status:20240624 1 1
"0"
localhost:0>SETBIT login_status:20240624 2 1
"0"
localhost:0>SETBIT login_status:20240624 3 1
"0"

查看某个用户当天是否登录:

localhost:0>GETBIT login_status:20240624 3
"1"
localhost:0>GETBIT login_status:20240624 4
"0"
localhost:0>

查看当天登录用户总数:

localhost:0>BITCOUNT login_status:20240624
"4"

3.2 签到打卡

在这里插入图片描述
设置 ID123 的用户在 202405 第一天和第六天进行了签到:

localhost:0>SETBIT sign:123:202405 0 1
"0"
localhost:0>SETBIT sign:123:202405 5 1
"0"

查看用户当月某日是否进行了签到:

localhost:0>GETBIT sign:123:202405 10
"0"
localhost:0>GETBIT sign:123:202405 0
"1"

统计当月的签到次数:

localhost:0>BITCOUNT sign:123:202405
"2"

查看当月第一次签到的日期:

localhost:0>BITPOS sign:123:202405 1
"0"

http://www.ppmy.cn/devtools/56845.html

相关文章

Linux Swap

Swap: 页面换出&#xff1a;就是在 Swap 机制下&#xff0c;当内存资源紧张时&#xff0c;内核就会把不经常使用的这些匿名页中的数据写入到 Swap 分区或者 Swap 文件中。从而释放这些数据所占用的内存空间。 页面换入&#xff1a;就是当进程再次访问那些被换出的数据时&…

Databend db-archiver 数据归档压测报告

Databend db-archiver 数据归档压测报告 背景准备工作Create target databend table启动 small warehouse准备北京区阿里云 ECSdb-archiver 的配置文件准备一亿条源表数据开始压测 背景 本次压测目标为使用 db-archiver 从 MySQL 归档数据到 Databend Cloud&#xff0c; 归档的…

TextField是用于在用户界面中输入文本的控件。它广泛应用于表单、搜索框、评论区等需要用户输入文字的场景

TextField是用于在用户界面中输入文本的控件。它广泛应用于表单、搜索框、评论区等需要用户输入文字的场景。以下是对TextField的详细解释&#xff0c;涵盖其各个方面的功能和属性。 基本属性 text 描述&#xff1a;TextField中当前显示的文本。用法&#xff1a;text: "示…

java面试之jvm常见面试题

1、JVM是什么&#xff1f;JVM的主要组成部分&#xff1f; JVM&#xff08;Java Virtual Machine&#xff09;是Java程序的执行环境&#xff0c;它使得Java程序能够“一次编写&#xff0c;到处运行”。JVM主要由以下部分组成&#xff1a; 1、类加载器&#xff08;ClassLoader&…

仓库管理系统12--供应商设置

1、添加供应商窗体 2、布局控件UI <UserControl x:Class"West.StoreMgr.View.SupplierView"xmlns"http://schemas.microsoft.com/winfx/2006/xaml/presentation"xmlns:x"http://schemas.microsoft.com/winfx/2006/xaml"xmlns:mc"http://…

构建LangChain应用程序的示例代码:48、如何使用非文本生成工具创建多模态代理

多模态输出&#xff1a;图像和文本 这个示例展示了如何使用非文本生成工具来创建多模态代理。 本例仅限于文本和图像输出&#xff0c;并使用UUID在工具和代理之间传输内容。 本例使用Steamship生成和存储生成的图像。生成的内容默认受到身份验证保护。 您可以在这里获取Ste…

XMind2TestCase:高效测试用例设计工具

XMind2TestCase&#xff1a;高效测试用例设计工具 引言传统测试用例设计的问题1. Excel表格的局限性2. 传统测试管理工具的不足3. 自研测试管理工具的挑战 思维导图在测试用例设计中的应用思维导图的优势思维导图的挑战 简介安装使用方式命令行调用使用Web界面 使用示例XMind文…

Linux运维:MySQL数据库(1)

1.信息与数据&#xff1a; 数据是信息的载体&#xff0c;信息是数据的内涵。数据库就是存储数据的仓库&#xff0c;并长期存储在计算机磁盘中&#xff0c;可由多个用户和应用程序共享的数据集合&#xff0c;就是数据库。 2.数据库中的数据的特点&#xff1a; 2.1.数据是按照某…