Apache BookKeeper并发容器实现中的关键缺陷分析

2025-07-06 08:48:29作者：盛欣凯Ernestine

Apache BookKeeper - a scalable, fault tolerant and low latency storage service optimized for append-only workloads

项目地址：https://gitcode.com/gh_mirrors/boo/bookkeeper

背景概述

Apache BookKeeper作为高性能的分布式日志存储系统，其内部实现大量使用了自定义的并发容器来优化性能。这些容器包括ConcurrentLongHashMap、ConcurrentLongHashSet、ConcurrentLongLongHashMap等，它们都基于类似的架构设计，采用分段锁和乐观读策略来提升并发性能。

问题本质

这些并发容器在实现上存在一个共同的严重缺陷：在rehash（重新哈希）操作期间，可能导致数组越界异常。这个问题的根源在于读取操作没有正确处理容量变化与数组访问之间的原子性关系。

具体来说，当执行读取操作时，代码会先获取当前容量并计算桶位置，然后再访问数组元素。这两个操作之间没有原子性保证，如果在它们之间发生了rehash操作（特别是缩容操作），就可能导致计算出的桶位置超出新数组的边界。

技术细节分析

以ConcurrentLongHashMap为例，其get方法的实现存在以下问题：

首先获取当前容量并计算桶位置
然后使用乐观读尝试获取键值对
在这两个步骤之间，其他线程可能完成rehash操作

当发生缩容时，新数组的容量可能小于旧数组，导致之前计算的桶位置在新数组中无效。这种竞态条件在高并发环境下可能导致ArrayIndexOutOfBoundsException。

影响范围

这个问题影响BookKeeper中所有基于相同设计模式的并发容器：

ConcurrentLongHashMap
ConcurrentLongHashSet
ConcurrentLongLongHashMap
ConcurrentLongLongPairHashMap
ConcurrentOpenHashMap
ConcurrentOpenHashSet

解决方案

正确的实现应该确保容量获取、桶位置计算和数组访问这三个操作在逻辑上具有原子性。可以采用以下模式修复：

在乐观读之前先获取当前容量
在验证乐观读时同时检查容量是否发生变化
如果容量发生变化，则放弃当前读取并重试

这种模式类似于Java中CAS（Compare-And-Swap）操作的思想，确保关键变量的读取一致性。

经验教训

这个案例给我们几点重要启示：

乐观并发控制需要仔细处理所有可能变化的共享变量
在涉及多步操作时，必须考虑中间状态变化的可能性
性能优化不能牺牲正确性，原子性保证是并发编程的基础
相似的设计模式可能隐藏相似的缺陷，需要系统性检查

总结

Apache BookKeeper中的这个并发容器缺陷展示了在高性能并发编程中容易忽视的一个典型问题。它提醒我们在追求性能的同时，必须确保基础的正确性。特别是在实现自定义并发数据结构时，需要仔细考虑所有可能的竞态条件，并对关键操作提供适当的原子性保证。

Apache BookKeeper - a scalable, fault tolerant and low latency storage service optimized for append-only workloads

项目地址：https://gitcode.com/gh_mirrors/boo/bookkeeper

登录后查看全文

项目优选

收起

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

flutter_flutter

Oohos_react_native

React Native鸿蒙化仓库

昇腾LLM分布式训练框架

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统