Redis底层数据结构
文章目录
- Redis底层数据结构
- 一:对象机制详解
- 二:SDS 简单动态字符串
- 三:压缩列表
- zipList结构
- 四:跳表
一:对象机制详解
- String类型 - 简单动态字符串SDS
- List类型 - 双向链表 & 压缩列表
- Set类型 - 哈希表和整数数组
- zset类型 - 压缩列表和跳表
- hash类型 - 压缩列表和哈希表
二:SDS 简单动态字符串
Redis 是用 C 语言写的,但是对于Redis的字符串,却不是 C 语言中的字符串(即以空字符\0
结尾的字符数组)
它是自己构建了一种名为简单动态字符串(simple dynamic string,SDS)的抽象类型,并将 SDS 作为 Redis的默认字符串表示。
用于存储二进制数据的一种结构,具有动态扩容的特点,实现位于src/sds.h
和sds.c
中
sdshdr就是头部,buf是实际存储数据的地方,这个数据结构除了存储二进制数据之外,还能存储对应的字符串,在buf中,用户数据的后面总是跟着一个\0
,数据 + \0 = buf
SDS有五种不同的头部. 其中sdshdr5实际并未使用到. 所以实际上有四种不同的头部
len
保存了SDS保存字符串的长度buf[]
数组用来保存字符串的每个元素alloc
分别以uint8, uint16, uint32, uint64表示整个SDS, 除过头部与末尾的\0, 剩余的字节数.flags
始终为一字节, 以低三位标示着头部的类型, 高5位未使用
一般来说,SDS 除了保存数据库中的字符串值以外,SDS 还可以作为缓冲区(buffer):包括 AOF 模块中的 AOF 缓冲区以及客户端状态中的输入缓冲区
三:压缩列表
zipList结构
是为了提高效率而设计的一种特殊编码的双向链表,可以存储字符串或者整数
存储整数的时候是采用整数的二进制而不是字符串的方式
能在O(1)的时间中完成list的push和pop相关的操作
因为每一次的操作都要重新分配ziplist的内存,所以实际的时间复杂度和ziplist的内存使用量相关
zlbytes
字段的类型是uint32_t, 这个字段中存储的是整个ziplist所占用的内存的字节数zltail
字段的类型是uint32_t, 它指的是ziplist中最后一个entry的偏移量. 用于快速定位最后一个entry, 以快速完成pop等操作zllen
字段的类型是uint16_t, 它指的是整个ziplit中entry的数量。这个值只占2bytes(16位):- 如果ziplist中entry的数目小于65535(216), 那么该字段中存储的就是实际entry的值
- 若等于或超过65535, 那么该字段的值固定为65535
- 但实际数量需要一个个entry的去遍历所有entry才能得到
zlend
是一个终止字节, 其值为0xff. ziplist保证任何情况下, 一个entry的首字节都不会是255
四:跳表
跳表结构在 Redis 中的运用场景只有一个,那就是作为有序列表 (Zset) 的使用。
跳跃表的性能可以保证在查找,删除,添加等操作的时候在对数期望时间内完成,但是缺点就会比较耗费内存的空间,跳表是典型的时间换空间的应用
/* ZSETs use a specialized version of Skiplists */
typedef struct zskiplistNode {sds ele; // 数据double score; // 得分struct zskiplistNode *backward; // 指针指向结点的前一个紧邻结点struct zskiplistLevel {struct zskiplistNode *forward; // 指向比自己得分高的某个结点unsigned int span; // forward字段指向的结点, 距离当前结点的距离} level[];
} zskiplistNode;typedef struct zskiplist {struct zskiplistNode *header, *tail;unsigned long length;int level;
} zskiplist;
设计核心
头节点不持有任何数据, 且其level[]的长度为32
每个结点
ele
字段,持有数据,是sds类型score
字段, 其标示着结点的得分, 结点之间凭借得分来判断先后顺序, 跳跃表中的结点按结点的得分升序排列.backward
指针, 这是原版跳跃表中所没有的. 该指针指向结点的前一个紧邻结点.- level字段, 用以记录所有结点(除过头节点外);每个结点中最多持有32个zskiplistLevel结构. 实际数量在结点创建时, 按幂次定律随机生成. 每个zskiplistLevel中有两个字段
forward
字段指向比自己得分高的某个结点(不一定是紧邻的), 并且, 若当前zskiplistLevel实例在level[]中的索引为X, 则其forward字段指向的结点, 其level[]字段的容量至少是X+1. 这也是上图中, 为什么forward指针总是画的水平的原因.span
字段代表forward字段指向的结点, 距离当前结点的距离. 紧邻的两个结点之间的距离定义为1.