Apache RocketMQ中LMQ消费模式下的消息重复问题分析

2025-05-09 03:13:28作者：袁立春Spencer

问题背景

在Apache RocketMQ 5.3.1版本中，使用LMQ(Light Message Queue)进行POP(Point of Point)模式消费时，出现了消息重复消费的问题。这是一个影响消息可靠性的严重缺陷，可能导致业务逻辑处理异常。

技术原理

LMQ是RocketMQ中的轻量级队列实现，相比传统队列具有更高的性能和更低的资源消耗。POP消费模式是一种拉取式消费方式，消费者主动从服务端获取消息，而不是服务端推送消息给消费者。

在正常情况下，RocketMQ应该保证消息的"恰好一次"投递语义，即每条消息只被消费一次。但在LMQ与POP模式结合使用时，出现了消息重复投递的情况。

问题分析

根据代码提交记录，这个问题在2025年1月6日通过提交9ce8345修复。虽然没有详细的修复说明，但可以推测问题可能出在以下几个方面：

消费位点管理异常：LMQ在POP模式下可能没有正确维护消费位点，导致消费者重复拉取已消费过的消息。
消息确认机制失效：POP模式下消费者确认消息消费完成的机制可能存在问题，导致服务端误认为消息未被成功消费。
并发控制缺陷：在多消费者场景下，LMQ的并发控制可能存在问题，导致同一条消息被分配给多个消费者。

影响范围

该问题影响所有使用以下配置的用户：

使用RocketMQ 5.3.1版本
启用了LMQ功能
采用POP模式进行消息消费

解决方案

对于遇到此问题的用户，建议采取以下措施：

升级版本：升级到修复该问题的版本(5.3.1之后的版本)。
业务层去重：在业务逻辑中实现消息去重机制，例如通过消息ID或业务唯一标识进行判重。
临时切换消费模式：如果不依赖LMQ特性，可以暂时切换回传统队列模式。

最佳实践

为了避免类似问题，建议开发人员：

在生产环境使用新特性前进行充分测试
实现幂等性消费逻辑
监控消息消费情况，及时发现异常

总结

消息中间件的可靠性是分布式系统的基石。Apache RocketMQ团队通过快速响应和修复这个LMQ消费重复问题，再次证明了其对消息可靠性的重视。作为用户，我们既要信任成熟的消息中间件，也要在业务层面做好防御性编程，以应对各种极端情况。

rocketmq

项目地址：https://gitcode.com/gh_mirrors/ro/rocketmq

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

nop-entropy

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

349

200

pytorch

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理