Kafka的架构解析

ops/2025/2/11 14:34:51/

1 背景

在这里插入图片描述

场景：
A服务每秒发送200个消息
B服务每秒处理100个消息

问题：
B服务会被压垮，那如何保证B能正常处理所有A的消息

方案：
增加中间层处理，该中间层可以是消息队列Kafka
在这里插入图片描述

kafka_18">2 kafka的架构来源

2.1 增加消息队列

基于上面的背景，我们可以在可以在B服务的内存中加一个队列，那什么是消息队列呢？
在这里插入图片描述
如上图的队列其实就是个链表，链表的每个节点就是一个消息，每个节点也有个序号叫做offset

B服务消费消息队列的消息，更新offset，如果处理的不及时，消息就会堆积在队列里，如果B服务重启，消息就都丢失了！将消息队列从B中挪出来作为一个单独的进程，即单独的服务，这样就互不影响。这样就有了简陋的消息队列。
在这里插入图片描述

2.2 高性能

如果B服务消费情况较差，可以增加消费者，增大消息队列的消费速度，与此同时可以增加生产者的数量，提高消息的吞吐量
在这里插入图片描述
当生产者和消费者的数量增多后会争抢同一个消息队列，抢不到的一方就要等待，比较浪费时间！

这时候就要增加消息队列了！每个消息队列就是一个topic
生产者按照topic将数据投递到不同的消息队列中，消费者根据topic订阅不同的topic
但是单个topic的消息可能过多
在这里插入图片描述

可以将单个队列拆分好几段，每一段就是一个partition，每个消费者消费一个partition，
随着partition增多会影响单机性能，导致CPU过高，影响整体系统性能。
在这里插入图片描述可以增加节点去缓解CPU的压力

2.3 高可用

在这里插入图片描述

如果partition所在节点故障会导致消息丢失，那就谈不上高可用了。此时我们就可以给partition增加副本，叫做ReplicaSet。
在这里插入图片描述
leader 负责应付生产者和消费者的请求，followers只管同步leader 的数据

把leader 和follower 分别部署在两个主机上，当其中一台挂掉，也不会影响另外一台的工作。如果主节点挂了还能从follower 中选出新的leader