Kafka常见问题之 org.apache.kafka.common.errors.RecordTooLargeException

news/2025/2/5 8:58:14/

文章目录

  • Kafka常见问题之 org.apache.kafka.common.errors.RecordTooLargeException: The message is 1,048,576 bytes when serialized which is larger than the maximum request size.
  • 1. 错误解析
  • 2. 错误原因
  • 3. 错误复现案例
    • 3.1 生产者发送超大消息
  • 4. 解决方案
    • 4.1 方法 1:调整 Kafka 生产者配置**
    • 4.2 方法 2:调整 Kafka Broker 配置
    • 4.3 方法 3:调整 Kafka 主题配置
    • 4.4 方法 4:调整 Kafka 消费者配置
    • 4.5 方法 5:大消息拆分
  • 5. 最佳实践:

apachekafkacommonerrorsRecordTooLargeException_The_message_is_1048576_bytes_when_serialized_which_is_larger_than_the_maximum_request_size_1">Kafka常见问题之 org.apache.kafka.common.errors.RecordTooLargeException: The message is 1,048,576 bytes when serialized which is larger than the maximum request size.

1. 错误解析

错误信息:

org.apache.kafka.common.errors.RecordTooLargeException: The message is 1,048,576 bytes when serialized which is larger than the maximum request size.

这个错误表明,Kafka 生产者在发送消息时,单条消息的序列化大小超出了 Kafka 允许的最大请求大小(默认 1MB,即 1,048,576 字节)。

2. 错误原因

  1. Kafka 生产者端限制

    • max.request.size(默认 1MB):生产者允许的最大单个请求大小。
  2. Kafka 代理端(Broker)限制

    • message.max.bytes(默认 1MB):Kafka Broker 允许的单条消息最大大小。
  3. Kafka 主题端(Topic)限制

    • max.message.bytes(默认 1MB):Kafka 主题允许的单条消息最大大小。
  4. Kafka 消费端限制

    • fetch.message.max.bytes:消费者可拉取的最大消息大小,若小于生产者消息大小,会导致消费者无法消费。

3. 错误复现案例

3.1 生产者发送超大消息

import org.apache.kafka.clients.producer.*;import java.util.Properties;public class LargeMessageProducer {public static void main(String[] args) {Properties props = new Properties();props.put("bootstrap.servers", "localhost:9092");props.put("key.serializer", "org.apache.kafka.common.serialization.StringSerializer");props.put("value.serializer", "org.apache.kafka.common.serialization.StringSerializer");props.put("max.request.size", 1048576); // 1MB,默认值KafkaProducer<String, String> producer = new KafkaProducer<>(props);String topic = "test-topic";String largeMessage = "A".repeat(1048577); // 1MB + 1 字节的消息ProducerRecord<String, String> record = new ProducerRecord<>(topic, largeMessage);try {producer.send(record);} catch (Exception e) {e.printStackTrace();} finally {producer.close();}}
}

结果:

org.apache.kafka.common.errors.RecordTooLargeException: The message is 1,048,577 bytes when serialized which is larger than the maximum request size.

4. 解决方案

4.1 方法 1:调整 Kafka 生产者配置**

KafkaProducer 配置中增加 max.request.size,提高消息允许的最大大小:

props.put("max.request.size", 5242880); // 5MB

4.2 方法 2:调整 Kafka Broker 配置

修改 server.properties

message.max.bytes=5242880  # 5MB
replica.fetch.max.bytes=5242880  # 让 Follower 可以拉取大消息

重启 Kafka:

bin/kafka-server-stop.sh
bin/kafka-server-start.sh -daemon config/server.properties

4.3 方法 3:调整 Kafka 主题配置

kafka-configs.sh --alter --zookeeper localhost:2181 --entity-type topics --entity-name test-topic --add-config max.message.bytes=5242880

4.4 方法 4:调整 Kafka 消费者配置

props.put("fetch.message.max.bytes", 5242880);

4.5 方法 5:大消息拆分

  • 将大消息拆分成多个小消息,并在消费端重组。

5. 最佳实践:

  1. 避免发送超大消息,Kafka 设计用于小消息(<1MB)。
  2. 使用压缩
    props.put("compression.type", "gzip"); // 也可以是 lz4, snappy
    
  3. 利用 Kafka 分片,拆分大文件存储到多个分区。

http://www.ppmy.cn/news/1569467.html

相关文章

【Java知识】使用Java实现地址逆向解析到区划信息

文章目录 1. 实现 FST1.1 定义 FST 节点1.2 定义 FST 2. 实现地址逆向查询2.1 定义区划信息2.2 构建 FST 3. 运行结果4. 代码说明5. 进一步优化6. 总结 实现一个 FST&#xff08;Finite State Transducer&#xff0c;有限状态转换器&#xff09; 并用于 地址逆向查询区划信息…

deepseek本地部署及可视化输入

deepseek本地部署及可视化输入 0 引言1 安装ollama2 下载并运行DeepSeek模型3 在Chatbox中接入Deepseek4 结语 0 引言 &#x1f4bb;&#x1f4bb;AI一下&#x1f4bb;&#x1f4bb; 先了解下什么是deepseek&#xff1a; DeepSeek 是一家专注于人工智能技术研发的公司&#x…

使用 Redis Streams 实现高性能消息队列

1. 引言 在后端开发中&#xff0c;消息队列是一个常见的组件&#xff0c;主要用于解耦系统、提高吞吐量以及实现异步处理。常见的消息队列包括 Kafka、RabbitMQ 以及 ActiveMQ&#xff0c;但 Redis Streams 作为 Redis 5.0 引入的新特性&#xff0c;也提供了一种高效、轻量的消…

如何在Arduino上使用NodeMCU

要在 Arduino IDE 中烧录 NodeMCU&#xff0c;可以按照以下步骤进行&#xff1a; 准备工作 硬件准备&#xff1a; 一根 USB 数据线&#xff0c;用于连接电脑和 NodeMCU 开发板。NodeMCU 开发板&#xff08;CH340 驱动版&#xff09;。 软件准备&#xff1a; 安装 Arduino IDE…

pytorch实现变分自编码器

人工智能例子汇总&#xff1a;AI常见的算法和例子-CSDN博客 变分自编码器&#xff08;Variational Autoencoder, VAE&#xff09;是一种生成模型&#xff0c;属于深度学习中的无监督学习方法。它通过学习输入数据的潜在分布&#xff08;Latent Distribution&#xff09;&…

对比JSON和Hessian2的序列化格式

在分布式系统中&#xff0c;数据的序列化和反序列化是关键环节。不同的序列化格式在性能、可读性和跨语言兼容性上存在显著差异。本文将详细对比JSON和Hessian2这两种序列化格式&#xff0c;以帮助开发者在不同的应用场景中做出更好的选择。 JSON 概述 JSON&#xff08;Java…

阻尼与共振:从理论到工程实践的深度解析

目录 一、阻尼&#xff08;Damping&#xff09;的本质与分类 1. 阻尼的物理意义 2. 阻尼的数学表达 3. 阻尼的四大类型 二、共振&#xff08;Resonance&#xff09;的原理与危害 1. 共振的产生条件 2. 共振的数学描述&#xff08;单自由度系统&#xff09; 3. 共振的工…

OpenCV4,快速入门,目录篇

文章目录 1. 摘要2. 课程目录参考 1. 摘要 本系列博客为OpenCV4初学开发者提供系统化实战教程&#xff0c;通过30讲内容从基础到进阶全面掌握图像与视频处理核心技能。内容概览&#xff1a; 基础操作&#xff1a;图像读取、显示、色彩空间转换&#xff08;RGB/HSV等&#xff…