rocketmq面试

news/2024/11/28 17:48:35/

broker主从复制机制

同步复制
等Master和Slave均写成功后,才反馈给客户端写成功状态;
如果Master出故障, Slave上有全部的备份数据,容易恢复,但是同步复制会增大数据写入延迟,降低系统吞吐量。
异步复制
只要Master写成功,即可反馈给客户端写成功状态。后面再通过异步的方式和slave同步。
较低的延迟和较高的吞吐量,如果master故障,有可能因为某些数据没有被写入slave,造成丢失。

复制流程分为两步,元数据同步、消息数据复制
元数据同步:Slave Broker 定时任务每隔 10 秒会同步元数据,包括主题,消费进度,延迟消费进度,消费者配置。
同步主题时, Slave Broker 向 Master Broker 发送 RPC 请求,返回数据后,首先加入本地缓存里,然后持久化到本地。

消息数据复制
1、Master 启动监听指定端口
2、Slave 启动 HaClient 服务,和 Master 创建 TCP 链接
3、Slave 向 Master 上报存储进度
4、Master 接收进度,消息文件中检索该偏移量后的所有消息,并传输给 Slave
5、Slave 接收到数据后,将消息数据 append 到本地的消息存储。

Master和Slave之间是怎么同步数据的呢
通过raft协议
在broker收到消息后,会被标记为uncommitted状态
然后会把消息发送给所有的slave
slave在收到消息之后返回ack响应给master
master在收到超过半数的ack之后,把消息标记为committed
发送committed消息给所有slave,slave也修改状态为committed

工作流程

1、启动NameServer,NameServer启动后监听端口,等待Broker、Producer、Consumer连上来,相当于一个路由控制中心。
2、Broker启动,跟所有的NameServer保持长连接,定时发送心跳包。心跳包中包含当前Broker信息(IP+端口等)以及存储所有Topic信息。注册成功后,NameServer集群中就有Topic跟Broker的映射关系。
3、收发消息前,先创建Topic,创建Topic时需要指定该Topic要存储在哪些Broker上,也可以在发送消息时自动创建Topic。
4、Producer发送消息,启动时先跟NameServer集群中的其中一台建立长连接,并从NameServer中获取当前发送的Topic存在哪些Broker上,轮询从队列列表中选择一个队列,然后与队列所在的Broker建立长连接从而向Broker发消息。
5、Consumer跟Producer类似,跟其中一台NameServer建立长连接,获取当前订阅Topic存在哪些Broker上,然后直接跟Broker建立连接通道,开始消费消息。
Master支持读和写,Slave仅支持读,也就是 Producer只能和Master连接写入消息;Consumer可以连接 Master,也可以连接Slave来读取消息。

在这里插入图片描述

持久化机制(刷盘)

同步刷盘:在返回写成功状态时,消息已经被写入磁盘。具体流程是,消息写入内存的PAGECACHE后,立刻通知刷盘线程刷盘, 然后等待刷盘完成,刷盘线程执行完成后唤醒等待的线程,返回消息写成功的状态。响应时间比异步多10%,用在对消息可靠性比较高的

异步刷盘:在返回写成功状态时,消息可能只是被写入了内存的PAGECACHE,写操作的返回快,吞吐量大;当内存里的消息量积累到一定程度时,统一触发写磁盘动作,快速写入。用在吞吐量比较高的

配置:Broker配置文件里的flushDiskType,SYNC_FLUSH(同步刷盘)、ASYNC_FLUSH(异步刷盘)

如何保证消息不丢失,保证消息的可用性/可靠性

producer:消息成功发送
同步发送,broker返回成功后,表示数据送到了

broker:消息持久化
消息持久化到commitLog
刷盘,同步刷盘和异步刷盘,将消息存储
master和slave的同步机制,同步双写可以保证在master宕机时,slave还可以有消息给consumer消费。

consumer:标记已经消费的消息offset
consumer中也保存了一个offset,用来表示消费成功却已经发回broker的消息下标,发回失败时也会定时重试,offset是持久化的。

消息存储结构

CommitLog
消息主体与元数据的存储主体,文件默认大小是1G,CommitLog 存储的数据是在当前这个broker中的所有的topic的数据
consumerQueue
只记录具体某个topic下的数据,一个topic下有多个consumerQueue,作为消费索引,它记录了指定topic的队列消息在CommitLog中的位置(物理位置偏移量offset

indexFile
indexes 里记录了 key的hash值,在commitLog中的偏移量,与 beginTimestamp的差值,下一个索引的值(记录key和offset的对应关系。

零拷贝

RocketMQ为什么速度快

是因为使用了顺序存储、Page Cache和异步刷盘。

我们在写入commitlog的时候是顺序写入的,这样比随机写入的性能就会提高很多

写入commitlog的时候并不是直接写入磁盘,而是先写入操作系统的PageCache

最后由操作系统异步将缓存中的数据刷到磁盘

如何保证顺序

顺序由producer发送到broker的消息队列是满足FIFO的,所以发送是顺序的,单个queue里的消息是顺序的。多个Queue同时消费是无法绝对保证消息的有序性的。所以,同一个topic,同一个queue,发消息的时候一个线程发送消息,消费的时候一个线程去消费一个queue里的消息。RocketMQ给我们提供了MessageQueueSelector接口,可以重写里面的接口,实现自己的算法,比如判断i%2==0,那就发送消息到queue1否则发送到queue2。


http://www.ppmy.cn/news/1418552.html

相关文章

今天掏心窝子!聊聊35岁了程序员何去何从?

今天的内容不聊技术,聊聊轻松的话题,脑子高速转了好几周,停下来思考一下人生…… 不对,关于35岁的问题好像也不轻松,些许有点沉重,反正不是技术,不用高速转动脑细胞了,哈哈。 兄弟…

Git 自定义命令

前言 在使用 hexo 搭建个人博客时,共两种部署的方法。分别为: 本地利用 hexo 的插件 hexo-deployer-git 来实现部署,缺点是需要多敲几个命令行且不方便对源码进行云端备份使用 Github Action 的 workflow 自动化部署,优势就是可…

韩顺平 | 零基础快速学Python(12) OOP基础

面向对象编程-基础 类与对象 类提供了把数据和功能绑定在一起的方法。创建新类时创建了新的对象类型,从而能够创建该类型的新实例/对象。 类时抽象的概念,作为数据类型代表一类事物;对象时具体实际的,作为实例代表具体事物&…

Web 题记

[极客大挑战 2019]LoveSQL 看到这种就肯定先想到万能密码,试试,得到了用户名和密码 总结了一些万能密码: or 11 oror admin admin-- admin or 44-- admin or 11-- admin888 "or "a""a admin or 22# a having 11# a havin…

C++中的vector容器

一. 基本概念 1. 包含在头文件 #include <vector> 2. 功能: 模拟了一个动态数组 3. 底层实现 首先开辟一定大小的数组 随着元素的增加&#xff0c;如果空间不够之后 自动采取扩容机制 -> 自增长 扩容规则&#xff1a;以原空间大小的 2 倍重新开辟一块空间 将就空…

Spring中基于事件监听驱动 和 线程池的异步任务

文章目录 事件监听驱动 与 异步事件源ApplicationContextAware接口 发布事件事件实体监听事件实现异步注入綫程池 事件驱动机制&#xff0c;与MQ消息队列比较 事件监听驱动 与 异步 事件监听驱动优点&#xff1a;解耦&#xff0c;将 事件和业务进行解耦&#xff0c;通过Asyc注解…

FMix: Enhancing Mixed Sample Data Augmentation 论文阅读

1 Abstract 近年来&#xff0c;混合样本数据增强&#xff08;Mixed Sample Data Augmentation&#xff0c;MSDA&#xff09;受到了越来越多的关注&#xff0c;出现了许多成功的变体&#xff0c;例如MixUp和CutMix。通过研究VAE在原始数据和增强数据上学习到的函数之间的互信息…

带头节点单向非循环链表的基本操作(c语言实现)

头节点 头节点是数据结构中的一个概念&#xff0c;特别是在链表结构中。 它通常被设置为链表的第一个节点之前的一个节点&#xff0c;其数据域一般不存储链表中的实际数据&#xff0c;而它的指针域则存储指向链表中第一个实际节点的指针。 头节点的主要作用如下&#xff1a;…