AutoMQ Kafka 对象读取器并发访问缺陷分析与修复

2025-06-06 10:50:36作者：齐添朝

在分布式消息系统 AutoMQ for Kafka 的核心组件中，对象读取器(ObjectReader)负责高效处理数据流。近期发现 DefaultObjectReaderFactory 实现中存在一个关键的并发控制缺陷，可能导致系统读取到已被释放的资源，进而引发数据一致性问题。

问题本质

DefaultObjectReaderFactory 通过 AsyncLRUCache 缓存对象读取器实例，其 get() 方法采用"按需创建"的惰性加载策略。原始实现中存在典型的"检查-执行"竞态条件：

首先检查缓存中是否存在目标读取器
若不存在则新建并缓存
返回获取到的读取器实例

这三个步骤未形成原子操作，当高并发场景下，可能出现线程A判断读取器不存在开始创建，而线程B恰好在该读取器被创建但未完全初始化完成时尝试获取，最终导致获取到状态异常的读取器实例。

技术影响

这种缺陷在实际运行中会表现为：

读取到已被释放的内存区域，导致数据损坏
引发空指针异常等运行时错误
在极端情况下可能造成数据丢失
系统稳定性下降，出现难以追踪的偶发故障

解决方案

修复方案采用双重检查锁(DCL)模式重构获取逻辑：

public ObjectReader get(String key) {
    ObjectReader reader = cache.getIfPresent(key);
    if (reader == null) {
        synchronized (this) {
            reader = cache.getIfPresent(key);
            if (reader == null) {
                reader = createReader(key);
                cache.put(key, reader);
            }
        }
    }
    return reader;
}