个人主页:C++忠实粉丝
欢迎 点赞👍 收藏✨ 留言✉ 加关注💓本文由 C++忠实粉丝 原创Redis Hash哈希
收录于专栏[redis]
本专栏旨在分享学习Redis的一点学习笔记,欢迎大家在评论区交流讨论💌
目录
概述
常见命令
HSET
HGET
HEXISTS
HDEL
HKEYS
HVALS
HGETALL
HMGET
HLEN
HSETNX
HINCRBY
命令小结
内部编码
使用场景
缓存方式对比
概述
几乎所有的主流编程语言都提供了哈希(hash)类型,它们的叫法可能是哈希、字典、关联数
组、映射。在 Redis 中,哈希类型是指值本身又是一个键值对结构,形如 key = "key",value = { {
field1, value1 }, ..., {fieldN, valueN } },Redis 键值对和哈希类型二者的关系可以用下图来表示。
哈希类型中的映射关系通常称为 field-value,用于区分 Redis 整体的键值对(key-value),
注意这里的 value 是指 field 对应的值,不是键(key)对应的值,请注意 value 在不同上下
文的作用。
常见命令
HSET
设置 hash 中指定的字段(field)的值(value)。
语法:
HSET key field value [field value ...]
命令有效版本:2.0.0 之后
时间复杂度:插入一组 field 为 O(1), 插入 N 组 field 为 O(N)
返回值:添加的字段的个数。
示例:
HGET
获取 hash 中指定字段的值。
语法:
HGET key field
命令有效版本:2.0.0 之后
时间复杂度:O(1)
返回值:字段对应的值或者 nil。
示例:
HEXISTS
判断 hash 中是否有指定的字段。
语法:
HEXISTS key field
命令有效版本:2.0.0 之后
时间复杂度:O(1)
返回值:1 表示存在,0 表示不存在。
示例:
HDEL
删除 hash 中指定的字段。
语法:
HDEL key field [field ...]
命令有效版本:2.0.0 之后
时间复杂度:删除一个元素为 O(1). 删除 N 个元素为 O(N).
返回值:本次操作删除的字段个数。
示例:
HKEYS
获取 hash 中的所有字段。
语法:
HKEYS key
命令有效版本:2.0.0 之后
时间复杂度:O(N), N 为 field 的个数.
返回值:字段列表。
示例:
HVALS
获取 hash 中的所有的值。
语法:
HVALS key
命令有效版本:2.0.0 之后
时间复杂度:O(N), N 为 field 的个数.
返回值:所有的值。
示例:
HGETALL
获取 hash 中的所有字段以及对应的值。
语法:
HGETALL key
命令有效版本:2.0.0 之后
时间复杂度:O(N), N 为 field 的个数.
返回值:字段和对应的值。
示例:
HMGET
一次获取 hash 中多个字段的值。
语法:
HMGET key field [field ...]
命令有效版本:2.0.0 之后
时间复杂度:只查询一个元素为 O(1), 查询多个元素为 O(N), N 为查询元素个数.
返回值:字段对应的值或者 nil。
示例:
注意:在使用 HGETALL 时,如果哈希元素个数比较多,会存在阻塞 Redis 的可能。如果开发人员只需要获取部分 field,可以使用 HMGET,如果一定要获取全部 field,可以尝试使用 HSCAN 命令,该命令采用渐进式遍历哈希类型,HSCAN 会在后续章节介绍。
HLEN
获取 hash 中的所有字段的个数。
语法:
HLEN key
命令有效版本:2.0.0 之后
时间复杂度:O(1)
返回值:字段个数。
示例:
HSETNX
在字段不存在的情况下,设置 hash 中的字段和值。
语法:
HSETNX key field value
命令有效版本:2.0.0 之后
时间复杂度:O(1)
返回值:1 表示设置成功,0 表示失败。
示例:
HINCRBY
将 hash 中字段对应的数值添加指定的值。
语法:
HINCRBY key field increment
命令有效版本:2.0.0 之后
时间复杂度:O(1)
返回值:该字段变化之后的值。
示例:
命令小结
下图是哈希类型命令的效果、时间复杂度,开发人员可以参考此表,结合自身业务需求和数据大小选择合适的命令。
命令 | 执行效果 | 时间复杂度 |
hset key field value | 设置值 | O(1) |
hget key field | 获取值 | O(1) |
hdel key field [field ...] | 删除 field | O(k),k 是 field 个数 |
hlen key | 计算 field 个数 | O(1) |
hgetall key | 批量获取 field-value | O(k),k 是 field 个数 |
hmget field [field ...] | 批量获取 field-value | O(k),k 是 field 个数 |
hexists key field | 判断 field 是否存在 | O(1) |
hvals key | 获取所有的 value | O(k),k 是 field 个数 |
hsetnx key field value | 设置值,但必须在 field 不存在时才能设置成功 | O(1) |
hkeys key | 获取所有的 field | O(k),k 是 field 个数 |
hmset field value [field value ...] | 批量获取 field-value | O(k),k 是 field 个数 |
hincrby key field value | 对应 field-value + n | O(1) |
hincrbyfloat key field n | 对应 field-value + n | O(1) |
hstrlen key field | 计算 value 的字符串长度 | O(1) |
内部编码
哈希表的内部编码有两种:
ziplist(压缩列表):当哈希类型元素个数小于 hash-maxziplist-entries 配置(默认 512 个)、同时所有值都小于 hash-max-ziplist-value 配置(默认 64 字节)时,Redis 会使用 ziplist 作为哈希的内部实现,ziplist 使用更加紧凑的结构实现多个元素的连续存储,所以在节省内存方面比 hashtable 更加优秀。
hashtable(哈希表):当哈希类型无法满足 ziplist 的条件时,Redis 会使用 hashtable 作为哈希的内部实现,因为此时 ziplist 的读写效率会下降,而 hashtable 的读写时间复杂度为 O(1)
下面的示例演示了哈希类型的内部编码,以及响应的变化。
1. 当 field 个数比较少且没有大的 value 时,内部编码为 ziplist:
2. 当 field 个数大于 64 字节时,内部编码会转换为 hashtable:
3. 当 field 个数超过 512 时,内部编码也会转换为 hashtable:
懒得打了……
使用场景
下图为关系数据库表记录的两条用户信息,用户的属性表现为表的列,每条用户信息表现为行。如果映射关系表示这两个用户信息,如下图所示:
uid | name | age | city |
---|---|---|---|
1 | james | 28 | Beijing |
2 | Johnathan | 30 | Xian |
相比于使用 JSON 格式的字符串缓存用户信息,哈希类型变得更加直观,并且在更新操作上变得更加灵活。可以将每个用户 id 定义为键后缀,多对 field-value 对应用户的各个属性,类似如下伪代码:
UserInfo getUserInfo(long uid)
{// 根据 uid 得到 Redis 的键String key = "user:" + uid;// 尝试从 Redis 中获取对应的值userInfoMap = Redis 执行命令:hgetall key;// 如果缓存命中(hit)if (value != null){// 将映射关系还原为对象形式UserInfo userInfo = 利用映射关系构建对象(userInfoMap);return userInfo;}// 如果缓存未命中(miss)// 从数据库中,根据 uid 获取用户信息UserInfo userInfo = MySQL 执行 SQL:select *from user_info where uid =<uid>// 如果表中没有 uid 对应的用户信息if (userInfo == null){响应 404 return null;}// 将缓存以哈希类型保存Redis 执行命令:hmset key name userInfo.name age userInfo.age cityuserInfo.city// 写入缓存,为了防止数据腐烂(rot),设置过期时间为 1 小时(3600 秒)Redis 执行命令:expire key 3600// 返回用户信息return userInfo;
}
但是需要注意的是哈希类型和关系型数据库有两点不同之处:
哈希类型是稀疏的,而关系数据库是完全结构化的,例如哈希类型每个键可以有不同的 field,而关系型数据库一旦添加新的列,所有行都要为其设置值,即使为 null。
关系数据库可以做复杂的关系查询,而 Reids 区模拟关系型复杂查询,例如联表查询、聚合查询等基本不可能,维护成本高。
缓存方式对比
截止目前为止,我们已经能够用三种方法缓存用户信息,下面给出三种方案的实现方法和优缺点分析。
1. 原生字符串类型 —— 使用字符串类型,每个属性一个键。
set user:1:name James
set user:1:age 23
set user:1:city Beijing
优点:实现简单,针对个别属性变得更加灵活。
缺点:占用过多的键,内存占用比较大,同时用户信息在 Redis 中比较分散,缺少内聚性,所以这种方案基本没有实用性。
2. 序列化字符串类型,例如 JSON 格式
set user:1 1 经过序列化后的用户对象字符串
优点:针对总是以整体作为操作的信息比较合适,编程也简单。同时,如果序列化方案选择合适,内存的使用效率很高。
缺点:本身序列化和反序列化需要一定开销,同时如果总是操作个别属性则非常不灵活。
3. 哈希类型
1 hmset user:1 name James age 23 city Beijing
优点:简单、直观、灵活。尤其是针对信息的局部变更或者获取操作。
缺点:需要控制哈希在 ziplist 和 hashtable 两种内部编码的转换,可能会造成内存的较大消耗。