Spring Kafka 3.3.x版本中监听器活跃度指标导致内存泄漏问题分析

2025-07-02 01:54:49作者：房伟宁

Provides Familiar Spring Abstractions for Apache Kafka

项目地址：https://gitcode.com/gh_mirrors/spr/spring-kafka

问题背景

在Spring Kafka 3.3.0和3.3.1版本中，当应用程序启用了Kafka监听器的观测功能后，会出现一个严重的内存泄漏问题。这个问题表现为spring.kafka.listener.active指标持续增长，导致大量DefaultLongTaskTimer实例无法被垃圾回收，最终耗尽系统内存资源。

问题现象

受影响的应用程序会表现出以下典型症状：

JVM堆内存持续增长，呈现明显的内存泄漏趋势
随着Prometheus等监控系统定期抓取指标，CPU使用率也会显著上升
最终可能导致监控端点响应超时或连接中断
当禁用spring.cloud.stream.kafka.binder.enableObservation配置时，系统资源消耗会恢复正常

根本原因分析

问题的根源在于Spring Kafka的观测(Observation)机制实现中存在一个逻辑缺陷。具体来说：

在KafkaMessageListenerContainer中，观测任务的停止逻辑依赖于监听器类型判断
对于非RecordMessagingMessageListenerAdapter类型的监听器，容器会直接调用observation.stop()
但对于RecordMessagingMessageListenerAdapter类型，预期是其父类的invoke()方法会在最后调用currentObservation.stop()
然而在使用Spring Cloud Stream Kafka Binder时，实际使用的是IntegrationRecordMessageListener（继承自RecordMessagingMessageListenerAdapter），它没有调用预期的父类invoke()方法
这导致观测任务永远不会被停止，相关的DefaultLongTaskTimer实例持续累积

技术细节

从实现层面来看，问题出在两个关键组件的交互上：

观测机制的生命周期管理：Spring Kafka引入了Micrometer的观测功能来监控监听器的活跃状态。每个消息处理都会创建一个新的观测任务，这些任务本应在处理完成后被清理。
监听器适配器的继承体系：Spring Cloud Stream通过KafkaMessageDrivenChannelAdapter创建了自己的监听器实现，这个实现虽然继承自RecordMessagingMessageListenerAdapter，但重写了关键方法，绕过了父类中负责清理观测任务的逻辑。

解决方案

针对这个问题，Spring Kafka团队已经提交了修复方案。修复的核心思路是：

确保无论使用哪种类型的监听器适配器，观测任务都能被正确清理
在容器层面统一处理观测任务的生命周期，而不是依赖监听器实现
特别处理Spring Cloud Stream集成场景下的特殊情况

影响范围

该问题影响：

使用Spring Kafka 3.3.0和3.3.1版本的应用
启用了观测功能的应用（默认开启）
特别是与Spring Cloud Stream集成的应用

临时解决方案

在官方修复版本发布前，可以采取以下临时措施：

降级到Spring Kafka 3.2.2版本
暂时禁用观测功能：设置spring.cloud.stream.kafka.binder.enableObservation=false

最佳实践建议

在升级Spring Kafka版本时，应充分测试监控指标相关的功能
对于高吞吐量的Kafka消费者，要特别注意内存和CPU的使用情况
定期检查Micrometer指标收集的性能影响
考虑对观测功能进行适当的采样率配置，避免产生过多临时对象

总结

这个内存泄漏问题展示了在框架集成时可能出现的微妙交互问题。Spring生态系统中各组件虽然设计精良，但在特定组合和版本下仍可能出现意料之外的行为。作为开发者，我们需要：

理解框架底层的工作原理
关注官方的问题修复和版本更新
建立完善的监控机制，及时发现类似问题
在问题出现时能够提供详细的复现步骤和环境信息，帮助快速定位问题

通过这个案例，我们也看到Spring团队对社区反馈的快速响应，这对于维护健康的开源生态系统至关重要。

Provides Familiar Spring Abstractions for Apache Kafka

项目地址：https://gitcode.com/gh_mirrors/spr/spring-kafka

登录后查看全文

项目优选

收起

deepin linux kernel

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

昇腾LLM分布式训练框架

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。