Kafka架构

ops/2025/2/4 21:51:01/

引言

Kafka 凭借其独树一帜的分区架构,在消息中间件领域展现出了卓越的性能表现。其分区架构不仅赋予了 Kafka 强大的并行计算能力,使其能够高效处理海量数据,还显著提升了系统的容灾能力,确保在复杂的运行环境中始终保持稳定可靠。本文将深入剖析 Kafka 的架构选型,通过对其底层逻辑的抽丝剥茧,帮助我们提炼架构设计的关键能力与思维模式,进而为优化自身系统架构提供极具价值的参考。

消息中间件通用架构

生产者

  • 功能:负责将消息发布到 Kafka 集群。生产者可以将消息发送到指定的主题(Topic),并根据分区策略决定消息发送到哪个分区。
  • 工作原理:生产者在发送消息时,会先将消息序列化为字节数组,然后根据主题和分区信息,将消息发送到对应的 Broker 节点。生产者还可以进行消息的批量发送、压缩等操作,以提高发送效率。

消费者

  • 功能:用于从 Kafka 集群中读取消息并进行处理。消费者可以订阅一个或多个主题,并从这些主题的分区中拉取消息进行消费。
  • 工作原理:消费者通过向 Broker 发送拉取请求来获取消息,它会记录自己已经消费到的消息偏移量(Offset),以便在下次拉取时从正确的位置继续读取。消费者可以以单线程或多线程的方式处理消息,并且可以将消费结果进行持久化或进行其他后续操作。

主题

  • 功能:是 Kafka 中消息的逻辑分类,类似于数据库中的表。每个主题可以包含多个分区,不同的主题可以用于不同的业务场景或数据类型。
  • 工作原理:生产者将消息发送到指定的主题,消费者通过订阅主题来获取该主题下的消息。主题可以配置不同的属性,如分区数量、副本因子等,以满足不同的业务需求。

代理

  • 功能:是 Kafka 集群中的服务器节点,负责接收生产者发送的消息,存储消息,并为消费者提供消息读取服务。
  • 工作原理:Broker 接收到生产者发送的消息后,会将消息写入到本地的磁盘日志文件中。当消费者请求消息时,Broker 会根据消费者的请求,从磁盘中读取相应的消息并返回给消费者。Broker 还负责管理分区的副本,进行数据的复制和同步,以保证数据的可靠性。

集群

  • 功能:由多个 Broker 节点组成,共同提供 Kafka 的消息存储和处理服务。集群可以实现高可用性、可扩展性和负载均衡。
  • 工作原理:集群中的 Broker 节点通过 Zookeeper 进行协调和管理,它们会相互通信,以确保数据的一致性和可用性。当集群中的某个 Broker 节点出现故障时,其他节点可以自动接管其工作,保证系统的正常运行。同时,集群可以通过添加新的 Broker 节点来扩展存储和处理能力。

独特架构

主题 + 分区

  • 功能:是主题的物理划分,每个主题可以分为多个分区。分区可以分布在不同的 Broker 节点上,实现数据的分布式存储和并行处理。
  • 工作原理:消息在写入主题时,会根据分区策略被分配到具体的分区中。每个分区内部的消息是有序的,消费者可以通过分区来并行地读取消息,提高消费效率。同时,分区还可以通过副本机制来保证数据的可靠性和容错性。
  • 独特性:可以将消息并行消费,同时不同Broker能保存相同的分区消息来实现容错性。

架构思维

  • 吞吐率:如何将消息并行化同时保持有序性,kafka给予了很好的范本
  • 容错性:默认副本机制,持久化的同时节点备份是最优解

http://www.ppmy.cn/ops/155681.html

相关文章

VU~大数据知识点总结

私信获取高清图片和其他资料

minimind - 从零开始训练小型语言模型

大语言模型(LLM)领域,如 GPT、LLaMA、GLM 等,虽然它们效果惊艳, 但动辄10 Bilion庞大的模型参数个人设备显存远不够训练,甚至推理困难。 几乎所有人都不会只满足于用Lora等方案fine-tuing大模型学会一些新的…

计算机网络网络层进阶:NAT、ARP 与 IP 系列技术全析!!!

一、网络地址转换NAT 私有IP 地址(内网IP): 10.0.0.0~10.255.255.255 172.16.0.0~172.31.255.255 192.168.0.0~192.168.255.255 只允许分配给局域网内部的节点,不允许分配给互联网上的节点每个局域网内部都可以自行分配这些私有 IP 地址私有 IP 地址是可复用的&…

Debian 10 中 Linux 4.19 内核在 x86_64 架构上对中断嵌套的支持情况

一、中断嵌套的定义与原理 中断嵌套是指在一个中断处理程序(ISR)正在执行的过程中,另一个更高优先级的中断请求到来,系统暂停当前中断处理程序,转而处理新的高优先级中断。处理完高优先级中断后,系统返回到原来的中断处理程序继续执行。这种机制允许系统更高效地响应紧急…

【ComfyUI专栏】如何使用Git命令行安装非Manager收录节点

当前的ComfyUI的收录的自定义节点很多,但是有些节点属于新出来,或者他的应用没有那么广泛,Manager管理节点 有可能没有收录到,这时候 如果我们需要安装需要怎么办呢?这就涉及到我们自己安装这些节点了。例如下面的内容…

node 爬虫开发内存处理 zp_stoken 作为案例分析

声明: 本文章中所有内容仅供学习交流使用,不用于其他任何目的,抓包内容、敏感网址、数据接口等均已做脱敏处理,严禁用于商业用途和非法用途,否则由此产生的一切后果均与作者无关! 前言 主要说3种我们补环境过后如果用…

LabVIEW无人机航线控制系统

介绍了一种无人机航线控制系统,该系统利用LabVIEW软件与MPU6050九轴传感器相结合,实现无人机飞行高度、速度、俯仰角和滚动角的实时监控。系统通过虚拟仪器技术,有效实现了数据的采集、处理及回放,极大提高了无人机航线的控制精度…

利用飞书机器人进行 - ArXiv自动化检索推荐

相关作者的Github仓库 ArXivToday-Lark 使用教程 Step1 新建机器人 根据飞书官方机器人使用手册,新建自定义机器人,并记录好webhook地址,后续将在配置文件中更新该地址。 可以先完成到后续步骤之前,后续的步骤与安全相关&…