redis 分布式方案

server/2025/1/22 20:34:50/

文章目录

  • 前言
  • 一、主从复制
    • 1、主从配置
    • 2、建立连接
    • 3、数据同步
      • 3.1、全量同步
      • 3.2、全量同步配置
      • 3.3、 增量同步
      • 3.4、 增量同步配置
  • 二、redis sentinel
    • 1、主要功能
    • 2、sentinel配置
    • 3、高可用
      • 3.1、故障发现
      • 3.2、故障转移
        • 3.2.1、选举sentinel进行故障转移
        • 3.2.2、选举从节点升级成主节点
        • 3.2.3、执行故障转移
    • 4、sentinel引来的问题
      • 4.1、配置小于三个的sentinel
      • 4.2、脑裂问题
  • 二、redis cluster
    • 1、虚拟槽
    • 2、数据对应
      • 2.1、全量key计算
      • 2.2、key统一映射
    • 3、数据迁移
      • 3.1 扩容
        • 3.1.1、启动新节点
        • 3.1.2、将新节点加入集群
        • 3.1.3、重新分配槽(resharding)
        • 3.1.4、迁移数据:
      • 3.2 缩容
        • 3.2.1、触发哈希槽转移:
        • 3.2.2、移动哈希槽到其他节点:
        • 3.2.3、关闭并移除节点:
    • 4、高可用性机制
      • 4.1、主从复制:
      • 4.2、故障检测:
    • 5、主从切换
      • 5.1、选择新的主节点
      • 5.2、将从节点提升为主节点
      • 5.3、恢复数据一致性和同步


前言

Redis 的分布式方案主要依赖于 Redis Cluster 和 Redis Sentinel 来实现。这两种部署方案都旨在解决单点故障问题,确保数据的高可用性和持续服务能力


一、主从复制

Redis 主从复制(Master-Slave Replication)是 Redis 提供的一种数据冗余和容灾保护机制。通过主从复制,可以将主节点的数据同步到一个或多个从节点,从而实现数据的高可用性和负载均衡。

  • 主节点(Master):作为数据的写入点,所有数据变更操作都是在主节点上进行的。
  • 从节点(Slave):从主节点同步数据,从节点通常只提供读操作,数据从主节点复制而来。

1、主从配置

假设我们有以下主节点和从节点:

主节点 IP:192.168.1.100
从节点 IP:192.168.1.101, 192.168.1.102

在主节点(192.168.1.100)配置 redis-master.conf:

port 6379
bind 0.0.0.0
protected-mode no

在从节点(192.168.1.101 和 192.168.1.102)配置 redis-replica.conf:

port 6380
bind 0.0.0.0
protected-mode no
replicaof 192.168.1.100 6379

主节点启动

redis-server redis-master.conf

从节点启动

redis-server redis-replica.conf

2、建立连接

首次成为从节点,执行replicaof ip port命令的时候就会保存服务器的IP与端口,建立心跳机制,保持正常的连接。
通过定时任务定时监听是否变更了主节点,需要重新同步。

3、数据同步

3.1、全量同步

  • master服务器收到slave的命令后(psync),判断slave传给我的master_replid(持久化在磁盘)是否跟我的replid一致,如果不一致或者传的是个空的,那么就需要全量同步。
  • slave首次关联master,从主同步数据,slave肯定是没有主的replid,所以需要进行全量同步
  • 全量同步步骤
    • master开始执行bgsave,生成一个RDB文件,并且把RDB文件和master的replid以及offerset传输给我们的slave
    • slave接收到rdb文件后,清空slave自己内存中的数据,然后用rdb来加载数据。
    • master生成RDB文件是用的bgsave生成,期间,是可以接收新的指令的。那么这些指令,我们需要找一个地方保存,等到slave加载完RDB文件以后要同步给slave。
      • 在master生成rdb文件期间,会接收新的指令,这些新的指令会保存在一个内存区间,这个内存区间就是 replication_buffer。
      • 这个空间不能太小,如果太小,为了数据安全,会关闭跟从库的网络连接。再次连接得重新全量同步,但是问题还在,会循环进行,导致崩溃

3.2、全量同步配置

replication_buffer配置详解
client-output-buffer-limit :

  • client-type:客户端类型(normal、replica 或 pubsub)。
  • hard-limit:绝对上限值,超过此值会立即关闭连接。
  • soft-limit 和 soft-seconds:软限制值和时间窗口,超过软限制在给定时间窗口后关闭连接。
client-output-buffer-limit replica 256mb 64mb 60

示例中,将从节点客户端的输出缓冲区硬限制设置为 256 MB,软限制设置为 64 MB,时间窗口为 60 秒。

3.3、 增量同步

  • 命令传播:在主节点和从节点的连接建立后,主节点会将收到的所有写命令(比如 SET、LPUSH、SADD 等)传播给从节点,从节点则执行这些命令以便与主节点保持一致。
  • 复制积压缓冲区:主节点维护一个固定大小的复制积压缓冲区(replication backlog),这个缓冲区保存了最近的写命令。这是一个环形缓冲区,即缓冲区内容会根据新命令不断覆盖旧命令。当从节点与主节点之间的连接暂时中断后重新连接时,可以使用复制积压缓冲区中保存的命令进行增量同步。
  • 增量同步触发:如果从节点与主节点的连接中断,并在短时间内重新建立连接,主节点会根据复制积压缓冲区找到断开期间的命令,并将这些命令发送给从节点,从节点对这些命令进行重放(replay),从而完成增量同步。
  • 无效的增量同步处理:如果复制积压缓冲区中的命令过期(即缓冲区被新命令覆盖)导致无法完成增量同步,主节点和从节点会重新执行全量同步(full synchronization),具体包括发送主节点当前所有数据快照(RDB 文件)并执行新的写命令。

3.4、 增量同步配置

  • repl-backlog-size:设置主节点复制积压缓冲区的大小。默认大小是 1 MB,可以根据需求适当调整。
repl-backlog-size 1048576  # 1 MB
  • repl-backlog-ttl:设置积压缓冲区在主节点与从节点断开连接后保留的时间(单位:秒)。在这个时间内,如果从节点重新连接主节点,则主节点将尝试进行增量同步。默认值是 3600 秒(即 1 小时)
repl-backlog-ttl 3600

redis_sentinel_87">二、redis sentinel

1、主要功能

  • 监控(Monitoring):
    Sentinel 实例会持续监控主节点和从节点,检测它们是否正常运转。
  • 通知(Notification):
    当检测到实例发生故障时,Sentinel 可以通知系统管理员或其他配置了通知功能的应用程序。
  • 自动故障转移(Automatic Failover):
    当主节点被判定为故障时,Sentinel 会自动选举一个从节点提升为新的主节点,并将其他从节点指向新的主节点。
  • 配置服务(Configuration Provider):
    客户端可以连接 Sentinel 来获取当前主节点的地址,以便动态调整连接。

2、sentinel配置

port 26379
bind 0.0.0.0# 监控主节点(mymaster),2 为 quorum:代表最少 2 个 Sentinel 同意主节点不可用,才会进行故障转移。
sentinel monitor mymaster <master_ip> 6379 2# 主节点在 5 秒内无响应则认为它主观下线(SDOWN)
sentinel down-after-milliseconds mymaster 5000# 故障转移超时时间
sentinel failover-timeout mymaster 15000# 同时最多允许多少个从节点与主节点进行同步
sentinel parallel-syncs mymaster 1

3、高可用

3.1、故障发现

  • 主观下线:
    当sentinel 跟master通信时(默认1s发送ping),发现我在一定时间内(down-after-milliseconds) 没有收到master的有效的回复,就会标记成
    SDOWN(Subjectively Down condition )(主观下线),
  • 客观下线:
    主观下线后,不会触发故障转移,而是去询问其他的sentinel,其他的sentinel是否能连上master,
    如果超过Quorum(规定人数)的sentinel都标记SDOWN状态,这个时候,就会将master标为ODOWN(Objectively Down condition 客观下线)

3.2、故障转移

3.2.1、选举sentinel进行故障转移
  • 当状态为ODWON的时候,我们就需要去触发故障转移,如果存在多个sentinel,我们需要选一个sentinel去做故障转移这件事情,然后其他sentinel不能进行故障转移。
  • 多个sentinel,我们需要选举一个sentinel来做这件事情
    • Quorum如果小于等于一半,那么必须超过半数的sentinel授权, 你才能去做故障迁移,比如5台sentinel,你配置的Quorum=2,那么选举的时候必须有3(5台的一半以上)人同意
    • Quorum如果大于一半,那么必须Quorum的sentinel授权,故障迁移才能启动
3.2.2、选举从节点升级成主节点

1)、与master的断开连接时间
如果slave与主服务器断开的连接时间超过主服务器配置的超时时间(down-after-milliseconds)的十倍,被认为不适合成为master。直接去除资格
2)、从节点排序
按照以下优先级排序(优先级逐一比较)

  • 与主节点连接状态良好的从节点
  • 复制偏移量最大(与主节点数据最接近)的从节点
  • 从节点 ID 较小的从节点(保证一致性,避免冲突)
    3)、排序后的第一个从节点将被提升为新的主节点
3.2.3、执行故障转移

Leader Sentinel 自动执行以下步骤,将选定的从节点提升为新的主节点:

  • 转换从节点为主节点:
    通过命令 SLAVEOF NO ONE
  • 重新配置其他从节点:
    通过命令 SLAVEOF <new_master_ip> <new_master_port> 重新配置其他从节点,以让它们同步新的主节点
  • 通知客户端和其他服务:
    更新 Sentinel 配置,通知客户端获取新的主节点信息,以确保所有读写操作指向新的主节点

4、sentinel引来的问题

4.1、配置小于三个的sentinel

  • 如果只有1个sentinel实例,则这个实例挂了就不能保证sentinel的高可用性
  • 如果只有2个sentinel实例,假设ip为127.0.0.1 为 sentinel1 和127.0.0.2 为 sentine2,那 sentinel1 跟 sentinel2 的网络断开,但是他们各自还是能正常运行的。也就是我们发生了分区容错,当quorum=1时
    • sentinel2检测到master不可用,因为127跟128网络断开,这个时候会触发主观下线,同时,sentinel2只能连接到1个sentinel,也满足半数以上原则(只有1个sentinel2)
    • sentinel2开启故障转移,将slave升级为master,就出现了2个master,这个情况也叫作脑裂。并且客户端会连接到2个master。(客户端连的是sentinel集群,sentinel1连到1.sentinel2 连到2)
    • 2个master都会写入数据,当网络恢复后,sentinel1的 master 会变成从,同步sentinel2的master数据,这个时候sentinel1的master数据就会丢失
      在这里插入图片描述

4.2、脑裂问题

配置三个sentinel也会出现脑裂问题,这是分区容错性的特性,例如三个就有可能出现这样的情况
在这里插入图片描述

解决方案

  • 避免双主问题
    • 自动化脚本和监控报警:结合监控系统检测网络分区和双主情况,自动化脚本以便手动恢复和协调主节点。
    • Automatic Fence:在检测到原主节点恢复上线时,通过脚本或其他机制自动将其降级为从节点,避免双主冲突。
  • 在Redis.cfg配置,通过配置这些参数,确保在任何无从节点可用的情况下,主节点停止写入,减少脑裂的可能性。
# 至少有1个从节点同步到我主节点的数据,但是由于是异步同步,所以是最终一致性 不会确保有数据写入
min-replicas-to-write 1 
# 判断上面1个的延迟时间必须小于等于10s
min-replicas-max-lag 10 

redis_cluster_175">二、redis cluster

Redis Cluster 是 Redis 3.0 版本后引入的一种分布式存储架构,它解决了单个 Redis 实例在面对海量数据和高并发写操作时遇到的瓶颈问题。为了实现这一点,Redis Cluster 引入了哈希槽(hash slot)的概念,并且采用了去中心化的集群管理方式,没有使用代理服务。
Cluster 一般由多个节点组成,节点数量至少为 6 个才能保证组成完整高可用的集群,其中三个为主节点,三个为从节点。三个主节点会分配槽,处理客户端的命令请求,而从节点可用在主节点故障后,顶替主节点
如图:
在这里插入图片描述

1、虚拟槽

Redis Cluster 采用虚拟哈希槽分区,所有的键根据哈希函数映射到 0 ~ 16383 整数槽内,计算公式:

HASH_SLOT = CRC16(key) % 16384

每一个节点负责维护一部分槽以及槽所映射的键值数据。
扩容或缩容,需要重新分配槽,也需要重新迁移数据,此过程不需要正常运行的服务下线。
此出采用 一致性hash 的算法。

假如,这里有 3 个节点的集群环境如下:

  • 节点 A 哈希槽范围为 0 ~ 5500;
  • 节点 B 哈希槽范围为 5501 ~ 11000;
  • 节点 C 哈希槽范围为 11001 ~ 16383。
    此时,我们如果要存储数据,按照 Redis Cluster 哈希槽的算法,假设结果是: CRC16(key) % 16384 = 6782。 那么就会把这个 key 的存储分配到 B 节点。此时连接 A、B、C 任何一个节点获取 key,都会这样计算,最终通过 B 节点获取数据。

假如这时我们新增一个节点 D,Redis Cluster 会从各个节点中拿取一部分 Slot 到 D 上,比如会变成这样:

  • 节点 A 哈希槽范围为 1266 ~ 5500;
  • 节点 B 哈希槽范围为 6827 ~ 11000;
  • 节点 C 哈希槽范围为 12288 ~ 16383;
  • 节点 D 哈希槽范围为 0 ~ 1265,5501 ~ 6826,11001 ~ 12287
    这种特性允许在集群中轻松地添加和删除节点。同样的如果我想删除节点 D,只需要将节点 D 的哈希槽移动到其他节点,当节点是空时,便可完全将它从集群中移除。

2、数据对应

2.1、全量key计算

我们会根据key 通过CRC16 取模 16383 得到一个0到16383的值 计算公式:slot = CRC16(key) & 16383,得到的值,就代表这个key在哪个虚拟槽
例如:

set k1 1:
CRC16(k1) & 16383=11901
set k2 1:
CRC16(k2) & 16383=10
set k3 1:
CRC16(k3) & 16383=6666
那么我们k1对应的槽是11901 k2对应的槽是10 k3对应的槽是666

key跟槽的关系是根据key算出来的,后续是不能变动。

2.2、key统一映射

如果想把相关key放入一个虚拟槽,也就是一个实例节点,我们可以采用{},那么就只会根据{}里面的内容计算hash槽。
例如:

set k1{123} 1:
CRC16(123) & 16383=11901
set k2{234} 1:
CRC16(234) & 16383=10
set k3{542} 1:
CRC16(542) & 16383=6666

3、数据迁移

3.1 扩容

扩容(添加新节点)过程中,数据迁移的主要步骤包含以下几个部分:

3.1.1、启动新节点

启动新的 Redis 实例作为集群的节点:

redis-cli --cluster add-node 127.0.0.1:6380 127.0.0.1:6379
3.1.2、将新节点加入集群

使用 redis-cli 命令将新的节点加入现有集群:

redis-cli --cluster add-node 127.0.0.1:6380 127.0.0.1:6379
3.1.3、重新分配槽(resharding)

使用 redis-cli 工具重新分配哈希槽,这会触发槽和数据的迁移:

redis-cli --cluster reshard 127.0.0.1:6379

交互过程中,指定将一定数量的哈希槽从现有节点迁移到新节点。

3.1.4、迁移数据:

redis-cli 自动处理哈希槽的迁移,并在后台进行数据的移动。此迁移是渐进式的,不会中断服务。

3.2 缩容

缩容(移除节点)过程中,数据迁移的主要步骤包含以下几个部分:

3.2.1、触发哈希槽转移:

首先,确定需要移除的节点ID,获取节点信息:

redis-cli --cluster nodes 127.0.0.1:6379
3.2.2、移动哈希槽到其他节点:

使用 redis-cli 工具将指定节点的槽迁移到其他节点:

redis-cli --cluster reshard 127.0.0.1:6379 --slots SLOT_NUMBER --from NODE_ID_TO_REMOVE --to TARGET_NODE_ID
3.2.3、关闭并移除节点:

当所有哈希槽和数据迁移完成后,安全地关闭并移除节点:

redis-cli --cluster del-node 127.0.0.1:6379 NODE_ID_TO_REMOVE

4、高可用性机制

Redis Cluster 通过以下机制确保系统的高可用性:

4.1、主从复制:

  • 在 Redis Cluster 中,每个主节点(master)都有一个或多个从节点(slave)作为其副本。主节点负责处理读写请求,而从节点负责复制主节点的数据。
  • 从节点持续异步地从主节点复制数据,以保证当主节点发生故障时,从节点能够接管其工作。

4.2、故障检测:

  • Redis Cluster 使用 gossip 协议进行节点间的状态通信,定期发送 PING 和 PONG 消息以确认节点是否存活。
  • 如果某节点未能在配置的超时时间(如 5 秒)内响应 PING 消息,那么该节点将被标记为疑似失效(PFAIL)。
  • 若某节点被多个其他节点标记为疑似失效且达到一定数量(如超过半数节点),该节点将被标记为真正失效(FAIL)。

5、主从切换

当主节点失效时,Redis Cluster 自动执行主从切换,以恢复集群的正常运行。主从切换的步骤如下:

5.1、选择新的主节点

  • Redis Cluster 会在原主节点的从节点中选取一个新的主节点。这个选择过程会基于从节点的优先级和副本状态(如复制的偏移量)进行。
  • 优先级高且数据复制进度最接近主节点的从节点将被优先选择。

5.2、将从节点提升为主节点

  • 选定新的主节点后,Redis Cluster 会将这个从节点提升为主节点。这个过程中,从节点需要执行步骤以更新其角色和状态,并接管原主节点负责的哈希槽。
  • 提升过程中,集群状态将在其他节点的帮助下完成同步并宣布新的主节点。

5.3、恢复数据一致性和同步

  • 当新的主节点被确认后,其他从节点将更新其复制源指向新的主节点,并开始从新的主节点重新同步数据。
  • 同时,客户端连接将通过 MOVED 响应被重新路由到新的主节点所在的位置。

http://www.ppmy.cn/server/160559.html

相关文章

navicat无法连接虚拟机的docker中的mysql

我的数据库安装在了虚拟机的docker中&#xff0c;启动MySQL后&#xff0c;在主机上使用navicat一直连接不上。 首先确认密码是否有问题&#xff1a; docker exec -it mysql8 bash #进入mysql容器 mysql -u root -p #登录MySQL&#xff0c;我这边密码是123456 密码没问题的话…

ovs实现lb负载均衡

负载均衡定义 负载均衡器的实现原理是通过硬件或软件设备将客户端访问流量根据转发策略分发到多个服务器或设备上&#xff0c;以确保系统的负载均衡。常见的实现方式包括&#xff1a; 二层负载均衡‌&#xff1a;使用虚拟MAC地址方式&#xff0c;根据OSI模型的二层进行负载均…

备赛蓝桥杯之第十五届职业院校组省赛第一题:智能停车系统

提示&#xff1a;本篇文章仅仅是作者自己目前在备赛蓝桥杯中&#xff0c;自己学习与刷题的学习笔记&#xff0c;写的不好&#xff0c;欢迎大家批评与建议 由于个别题目代码量与题目量偏大&#xff0c;请大家自己去蓝桥杯官网【连接高校和企业 - 蓝桥云课】去寻找原题&#xff0…

【C++】模板(进阶)

本篇我们来介绍更多关于C模板的知识。模板初阶移步至&#xff1a;【C】模板&#xff08;初阶&#xff09; 1.非类型模板参数 1.1 非类型模板参数介绍 模板参数可以是类型形参&#xff0c;也可以是非类型形参。类型形参就是我们目前接触到的一些模板参数。 //类型模板参数 …

Kafka 日志存储 — 日志索引

每个日志分段文件对应两个索引文件&#xff1a;偏移量索引文件用来建立消息偏移量到物理地址之间的映射&#xff1b;时间戳索引文件根据指定的时间戳来查找对应的偏移量信息。 1 日志索引 Kafka的索引文件以稀疏索引的方式构造消息的索引。它并不保证每个消息在索引文件中都有…

【Vim Masterclass 笔记18】第八章 + S08L35:Vim 的可视化模式(二)

文章目录 S08L35 Visual Mode - Part 21 利用可视化模式控制代码块的缩进2 缩进宽度的设置3 仅对选中区域执行替换操作4 利用可视化模式实现文本对齐 写在前面 本篇为 Vim 可视化模式的第二部分&#xff0c;主要介绍了可视化模式在代码缩进方面的应用。该视频应该录制于 2018 年…

高效实现 Markdown 转 PDF 的跨平台指南20250117

高效实现 Markdown 转 PDF 的跨平台指南 引言 Markdown 文件以其轻量化和灵活性受到开发者和技术写作者的青睐&#xff0c;但如何将其转换为易于分享和打印的 PDF 格式&#xff0c;是一个常见需求。本文整合了 macOS、Windows 和 Linux 三大平台的转换方法&#xff0c;并探讨…

蓝桥杯算法|基础笔记(1)

**时间复杂度** 一、概念理解 时间复杂度是用来衡量算法运行时间随输入规模增长而增长的量级。它主要关注的是当输入规模趋向于无穷大时&#xff0c;算法执行基本操作的次数的增长趋势&#xff0c;而不是精确的运行时间。 二、分析代码中的基本操作 确定关键操作 在一段代码…