Apache Pulsar中CurrentLedgerRolloverIfFullTest测试失败问题分析

2025-05-17 13:12:50作者：龚格成

Apache Pulsar - distributed pub-sub messaging system

项目地址：https://gitcode.com/gh_mirrors/pulsar28/pulsar

问题背景

在Apache Pulsar项目的测试套件中，CurrentLedgerRolloverIfFullTest.testCurrentLedgerRolloverIfFull测试用例出现了间歇性失败的情况。这个测试主要验证当账本(Ledger)写满时，系统能否正确执行账本滚动(rollover)操作。

错误现象

测试失败时抛出的异常显示，测试预期账本数量为5个，但实际检测到6个账本。从堆栈跟踪可以看出，这是一个简单的数值断言失败。

根本原因分析

经过深入分析，发现这个问题是由于测试用例中存在竞态条件(Race Condition)导致的。具体来说：

测试设置了maxEntriesPerLedger=2，即每个账本最多包含2条消息
然后发送了10条消息，理论上应该创建5个账本(10/2=5)
但是系统在创建第5个账本后，会立即准备第6个账本以接收后续消息
由于异步操作的时间不确定性，测试断言可能在系统创建第6个账本之前或之后执行

解决方案

正确的做法应该是：

等待系统完成所有账本创建操作
确认第6个账本确实已经创建
然后进行断言验证

这个修复已经被合并到主分支中，解决了测试的稳定性问题。

技术启示

这个问题给我们几个重要的技术启示：

在测试异步系统时，必须考虑操作完成的时间不确定性
对于账本滚动这类操作，测试应该等待所有预期状态达成后再进行验证
简单的数值断言可能不足以覆盖分布式系统的复杂性
测试设计需要考虑系统内部状态转换的完整生命周期

通过这个案例，我们可以更好地理解Apache Pulsar内部账本管理机制的工作原理，以及如何编写更健壮的测试来验证这类分布式系统的行为。

Apache Pulsar - distributed pub-sub messaging system

项目地址：https://gitcode.com/gh_mirrors/pulsar28/pulsar

登录后查看全文

项目优选

收起

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

flutter_flutter

deepin linux kernel

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

ohos_react_native

React Native鸿蒙化仓库

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

cangjie_compiler

仓颉编译器源码及 cjdb 调试工具。