九. Redis 持久化-RDB(详细讲解说明,一个配置一个说明分析,步步讲解到位)

news/2025/2/5 9:14:05/

九. Redis 持久化-RDB(详细讲解说明,一个配置一个说明分析,步步讲解到位)

文章目录

  • 九. Redis 持久化-RDB(详细讲解说明,一个配置一个说明分析,步步讲解到位)
  • 1. RDB 概述
  • 2. RDB 持久化执行流程
  • 3. RDB 的详细配置
  • 4. RDB 备份&恢复
  • 5. RDB 持久化小结(优势 和 劣势)
  • 6. 最后:


Redis 持久化-RDB:官网文档地址: https://redis.io/docs/latest/operate/oss_and_stack/management/persistence/

在这里插入图片描述

Redis 关于持久化方案:有两种:

  1. RDB(Redis DataBase)
  2. AOF(Append Of File)

这里我们主要介绍 RDB 持久化方案,AOF 持久化方案,在下一篇文章当中。

1. RDB 概述

RDB 是什么 ?:

在指定的时间间隔内将内存当中的数据集快照写入到磁盘当中,也就是 Snapshot 快照,恢复时将快照文件当中的内容读取到内存 当中。

2. RDB 持久化执行流程

RDB 及其执行流程:

在这里插入图片描述

对上图的解读:

具体流程如下:

  1. Redis 客户端执行 bgsave 命令或者自动触发 bgsave 命令。
  2. 主进程判断当前是否已经存在正在执行的子进程 ,如果存在,那么主进程直接返回。
  3. 如果不存在,正在执行的子进程 ,那么就 fork 一个新的子进程进行持久化数据,fork 过程是阻塞的,fork 操作完成后主进程即可执行其它操作。
  4. 子进程先将数据写入到 临时的 rdb 文件中 ,待快照数据写入完成后,再原子替换旧的 rdb 文件。
  5. 同时发送信号给主进程,通知主进程 rdb 持久化完成,主进程更新相关的统计信息。

小结:

  1. 整个过程中,主进程是不进行任何 IO 操作的,这就确保了极高的性能。
  2. 如果需要进行大规模数据的恢复,且对于数据恢复的完整性不是非常敏感,那 RDB 方式要比 AOF 方式更加的高效。
  3. RDB的缺点是最后一次持久化的数据可能丢失。

如果你是正常关闭 Redis ,仍然会进行持久化,不会造成数据丢失。

如果是 Redis 异常终止/宕机 ,就可能造成数据丢失。

后面在讲解快照配置的时候,进行说明。

Fork&Copy-On-Write:

  1. Fork 的作用是复制一个与当前进程一样的进程。新进程的所有数据(变量,环境变量,程序计数器等)数值都和原进程一致,但是是一个全新的进程,并作为原进程的子进程。

  2. 在 Linux 程序中,fork() 会产生一个和父进程完全相同的子进程,但子进程在此后都会 exec 系统调用,出于效率考虑,Linux 中引入了 “写时复制技术 即:copy-on-write” ,有兴趣的可以移步至🌟🌟🌟 https://blog.csdn.net/Code_beeps/article/details/92838520 一位网友的解读。

  3. 一般情况父进程和子进程会共用一段物理内存,只有进程空间的各段的内容要发送变化时,才会将父进程的内容复制一份给子进程。

3. RDB 的详细配置

  1. 默认快照配置:

Redis 当中的快照的文件是名为 dump.rdb 文件,这是默认的。

在 /etc/redis.conf 中配置文件名称当中,存在这个 dump.rdb 的配置。
在这里插入图片描述

如何配置

默认为 Redis 启动时命令行所在的目录下:

意思就是:默认会将 “dump.rdb” 快照文件存储到 Redis 启动时命令行所在的目录下
在这里插入图片描述

重点: 进入到/usr/local/bin 目录下, 启动 Redis, 这个那么这里的 ./ 所指的路径就是 /usr/local/bin , 如果你在 /root/ 目录下启动 Redis , 那么这里 ./ 所指的就是 /root/ 下了路径 , 这点请大家注意。

在这里插入图片描述

那么这样的默认配置就存在一个问题,那就是,如果我们每次去到不同的目录下启动 redis 的化,那么这个dump.rdb(快照存储我们信息/数据的文件) 就会存储到不同的目录下,这样就导致了,如果该目录下没有我们之前执行存储的数据的 dump.rdb 文件的话,我们Redis 就无法读取到该存有我们之前dump.rdb 数据的文件,也就无法恢复我们之前存储操作的数据了。

演示:

我们创建两个目录:分别是: test01,和 test02
在 test01 目录下执行 set k1 "test01"  同时查看该目录下是否生成 dump.rdb(快照文件)
在 test02 目录下执行 set k2 "test02" 同时查看该目录下是否生成 dump.rdb(快照文件)
[root@localhost home]# mkdir test01 # 创建目录

在这里插入图片描述

[root@localhost test01]# redis-cli
127.0.0.1:6379> keys *
(error) NOAUTH Authentication required.
127.0.0.1:6379> auth rainbowsea
OK
127.0.0.1:6379> keys *
(empty array)
127.0.0.1:6379> set k1 "test01"
OK
127.0.0.1:6379> keys *
1) "k1"

在这里插入图片描述

在这里插入图片描述

同理执行:test02

在这里插入图片描述

在这里插入图片描述

怎么解决这个,Redis 在不同的目录下,导致数据存储快照不同,数据没有跟上?

我们可以自定义配置好这个 dump.rdb 文件的存放路径,不是默认的dir./(根据启动Redis目录不同而变化) ,而是一直配置在一个固定的路径下。就可以解决这个问题了。

这里我们将其配置到 /root/ 目录下,这样我们每次生成的 dump.rdb 文件就一直是在同一个路径的目录下了

dir /root/

在这里插入图片描述

注意:需要关闭 Redis 服务,重新启动 Redis 服务,配置才会生效

[root@localhost test02]# redis-server /etc/redis.conf
[root@localhost test02]# redis-cli

在这里插入图片描述

在这里插入图片描述

  1. save 和 bgsave
127.0.0.1:6379> save
127.0.0.1:6379> bgsave

在这里插入图片描述

默认的快照配置: 如图:同样是在 `/etc/redis.conf文件当中配置的。
在这里插入图片描述

在这里插入图片描述

注意理解这个时间段的概念.:

在这里插入图片描述

如果我们没有开启 save 的注释 那么在退出,Redis 时 也会进行备份 更新 dump.rdb 文件的。

  • save : save 时只管保存,其它不管,全部阻塞。手动保存,不建议。
  • bgsave: Redis 会在后台异步进行快照操作,快照同时还可以响应客户端请求。
  • 可以通过 lastave 命令获取最后一次成功执行快照的时间(unix 时间戳),可以使用工具转换。https://tool.lu/timestamp/
  1. flushall
  • 执行 flushall 命令,也会产生 dump.rdb 文件,数据为空。
  • Redis Flushall 命令用于清空整个 Redis 服务器的数据(删除所有数据库的所有 key )
    在这里插入图片描述

在这里插入图片描述

  1. Save

格式:save 秒钟 写操作次数, 如图

在这里插入图片描述

在这里插入图片描述

RDB 是整个内存的压缩过的 Snapshot,RDB 的数据结构,可以配置复合的快照触发条件

禁用:给 save 传空字符串,可以看文档:

  1. stop-writes-on-bgsave-error
    在这里插入图片描述

意思是:当 Redis 无法写入磁盘的话(比如磁盘满了), 直接关掉 Redis 的写操作。推荐 yes

  1. rdbcompression

在这里插入图片描述

该配置的意思是:

  1. 对于存储到磁盘中的快照,可以设置是否进行压缩存储。如果是的话,redis 会采用 LZF 算法进行压缩。
  2. 如果你不想消耗 CPU 来进行压缩的话,可以设置为关闭此功能,默认 yes。
  1. rdbchecksum

在这里插入图片描述

该配置的意思是:

  1. 在存储快照后,还可以让 redis 使用 CRC64算法来进行数据校验,保证文件是完整的。
  2. 但是这样做会增加大约 10% 的性能消耗,如果希望获取到最大的性能提升,可以关闭此功能,推荐 yes 打开。
  1. 动态停止 RDB:

  2. 动态停止RDB: redis-cli config set save "" ,就是给 save 属性赋值为 ""空字符串,表示禁用保护策略。这里使用命令是让 客户端在此刻,启动的客户端停止 RDB,一旦退出了该客户端就,该配置就失效了。RDB 持久化策略又启动了。


示例演示:

需求: 如果 Redis 的 key 在 30 秒内, 有 5 个 key 变化, 就自动进行 RDB 备份.
在这里插入图片描述

save 30 5

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

4. RDB 备份&恢复

Redis 可以充当缓存,对项目进行优化,因此重要/敏感的数据建议在 MySQL要保存一份。

从设计层面来说,Redis 的内存数据,都是可以重新获取的(可能来自程序,也可能来自MySQL)

因此我们这里说的备份&恢复主要是给大家说明一下 Redis 启动时,初始化数据是从 dump.rdb 来的 整个机制。

演示:

这里我们演示的是:

将我们已经的 dump.rdb 备份文件复制拷贝(备份)一份,复制后之后,再将原来的dump.rdb 文件删除了(模拟文件损坏了,或者是执行 flushall 删除库)。再将我们拷贝备份的 dum.rdb 文件,复制过去,然后重启 redis 读取 dump.rdb 备份文件当中的数据,进行一个数据上的恢复。

config get dir 查询 rdb 文件的目录

127.0.0.1:6379> config get dir

在这里插入图片描述

将 dump.rdb 进行备份 如果有必要可以写 shell 脚本来定时备份 [参考韩顺平老师 Linux 课程定时
,备份 Mysql 数据库视频地址 https://www.bilibili.com/video/BV1Sv411r7vd?p=105 ] 。

[root@localhost ~]# cp /root/dump.rdb /root/dump.rdb.bak

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

127.0.0.1:6379> flushall

在这里插入图片描述

在这里插入图片描述

注意:这里得关闭一下服务器

在这里插入图片描述

[root@localhost ~]# rm /root/dump.rdb # 删除文件夹

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

关闭 Redis 服务器,重新启动 Redis 服务器,让它读取到我们配置的dump.rdb 备份文件,恢复我们的数据信息。

在这里插入图片描述

5. RDB 持久化小结(优势 和 劣势)

优势:

  1. 适合大规模的数据恢复
  2. 对数据完整性和一致性要求不高更适合使用
  3. 节省磁盘空间
  4. 恢复速度快
    在这里插入图片描述

劣势:

  1. 虽然 Redis 在 fork 时使用了写时拷贝技术(Cop-On-Write) ,但是如果数据庞大时还是比较消耗性能。
  2. 在备份周期在一定间隔时间做一次备份,所以如果 Redis 意外 down 掉 的话(如果正常关闭 Redis仍然会进行 RDB 备份,不会丢失数据),就会丢失最后一次快照后的所有修改。

6. 最后:

“在这个最后的篇章中,我要表达我对每一位读者的感激之情。你们的关注和回复是我创作的动力源泉,我从你们身上吸取了无尽的灵感与勇气。我会将你们的鼓励留在心底,继续在其他的领域奋斗。感谢你们,我们总会在某个时刻再次相遇。”

在这里插入图片描述


http://www.ppmy.cn/news/1569470.html

相关文章

Nacos 的介绍和使用

1. Nacos 的介绍和安装 与 Eureka 一样,Nacos 也提供服务注册和服务发现的功能,Nacos 还支持更多元数据的管理, 同时具备配置管理功能,功能更丰富。 1.1. windows 下的安装和启动方式 下载地址:Release 2.2.3 (May …

Github 2025-02-03 开源项目周报 Top14

根据Github Trendings的统计,本周(2025-02-03统计)共有14个项目上榜。根据开发语言中项目的数量,汇总情况如下: 开发语言项目数量Python项目3TypeScript项目3非开发语言项目2JavaScript项目2Ruby项目1HTML项目1Go项目1Svelte项目1C++项目1Jupyter Notebook项目1Shell项目1Ol…

Kafka常见问题之 org.apache.kafka.common.errors.RecordTooLargeException

文章目录 Kafka常见问题之 org.apache.kafka.common.errors.RecordTooLargeException: The message is 1,048,576 bytes when serialized which is larger than the maximum request size.1. 错误解析2. 错误原因3. 错误复现案例3.1 生产者发送超大消息 4. 解决方案4.1 方法 1&…

【Java知识】使用Java实现地址逆向解析到区划信息

文章目录 1. 实现 FST1.1 定义 FST 节点1.2 定义 FST 2. 实现地址逆向查询2.1 定义区划信息2.2 构建 FST 3. 运行结果4. 代码说明5. 进一步优化6. 总结 实现一个 FST(Finite State Transducer,有限状态转换器) 并用于 地址逆向查询区划信息…

deepseek本地部署及可视化输入

deepseek本地部署及可视化输入 0 引言1 安装ollama2 下载并运行DeepSeek模型3 在Chatbox中接入Deepseek4 结语 0 引言 💻💻AI一下💻💻 先了解下什么是deepseek: DeepSeek 是一家专注于人工智能技术研发的公司&#x…

使用 Redis Streams 实现高性能消息队列

1. 引言 在后端开发中,消息队列是一个常见的组件,主要用于解耦系统、提高吞吐量以及实现异步处理。常见的消息队列包括 Kafka、RabbitMQ 以及 ActiveMQ,但 Redis Streams 作为 Redis 5.0 引入的新特性,也提供了一种高效、轻量的消…

如何在Arduino上使用NodeMCU

要在 Arduino IDE 中烧录 NodeMCU,可以按照以下步骤进行: 准备工作 硬件准备: 一根 USB 数据线,用于连接电脑和 NodeMCU 开发板。NodeMCU 开发板(CH340 驱动版)。 软件准备: 安装 Arduino IDE…

pytorch实现变分自编码器

人工智能例子汇总:AI常见的算法和例子-CSDN博客 变分自编码器(Variational Autoencoder, VAE)是一种生成模型,属于深度学习中的无监督学习方法。它通过学习输入数据的潜在分布(Latent Distribution)&…