NATS服务器中消费者过滤主题与起始时间策略的Bug分析

2025-05-13 06:58:18作者：毕习沙Eudora

问题背景

在NATS消息系统中，消费者(Consumer)可以通过设置过滤主题(filter_subjects)来订阅特定模式的消息。近期发现当消费者同时使用多个精确匹配的过滤主题(filter_subjects)和按起始时间(by_start_time)的投递策略时，会出现消息接收不全的问题。

问题现象

在一个包含三个消息的测试流(stream)中：

消息主题分别为events.subjectOne、events.subjectTwo和events.subjectThree

创建两个消费者进行测试：

使用通配符模式filter_subjects: ["events.*"]的消费者能正确识别所有3条消息
使用精确匹配filter_subjects: ["events.subjectOne","events.subjectTwo","events.subjectThree"]的消费者却只识别到2条消息

技术分析

这个问题特别出现在以下组合条件下：

消费者配置了多个精确匹配的过滤主题
同时设置了按起始时间的投递策略(deliver_policy: by_start_time)
流中包含多个不同主题的消息

核心问题在于服务器在处理这种组合情况时，对消息序列的遍历逻辑存在缺陷。当使用精确匹配多个主题时，服务器未能正确计算所有符合条件的消息数量，导致num_pending值不准确，进而影响了消息的投递。

影响范围

该问题会影响以下使用场景：

需要精确控制订阅多个特定主题的应用程序
使用按时间点恢复消息的消费场景
需要保证消息完整性的关键业务系统

解决方案

NATS开发团队已经确认并修复了这个问题。修复方案改进了消费者创建时的消息遍历逻辑，确保在组合使用多个精确匹配主题和起始时间策略时，能够正确识别所有符合条件的消息。

最佳实践建议

对于需要使用类似配置的用户，建议：

在修复版本发布前，可考虑使用通配符模式作为临时解决方案
对于关键业务系统，建议进行全面测试验证
监控消费者的num_pending值，确保与预期消息数量一致

总结

这个案例展示了消息系统中过滤机制与投递策略组合使用时可能出现的边缘情况。NATS团队快速响应并修复了这个问题，体现了开源社区对系统稳定性和可靠性的重视。对于系统集成商和开发者而言，理解这类底层机制有助于构建更健壮的消息处理系统。

nats-server

项目地址：https://gitcode.com/GitHub_Trending/na/nats-server

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

leetcode

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.37 K

781