Apache BRPC中bthread_keytable内存泄漏问题分析与解决方案

2025-05-13 02:19:27作者：邬祺芯Juliet

brpc is an Industrial-grade RPC framework using C++ Language, which is often used in high performance system such as Search, Storage, Machine learning, Advertisement, Recommendation etc. "brpc" means "better RPC".

项目地址：https://gitcode.com/GitHub_Trending/brpc/brpc

问题背景

在Apache BRPC 1.10版本中，用户报告了一个关于bthread_keytable的内存泄漏问题。该问题表现为随着系统运行，内存使用量持续增长，通过监控发现bthread_keytable_count指标不断上升。这个问题在1.8版本中并不存在，但在升级到1.10版本后开始出现。

技术原理分析

bthread_keytable是BRPC中用于管理线程局部存储(Thread Local Storage, TLS)的关键数据结构。在BRPC的bthread实现中，每个bthread都可以拥有自己的keytable，用于存储线程特定的数据。

在1.10版本中，keytable的管理机制发生了变化。当bthread需要keytable时，会尝试从当前pthread的线程本地存储中"借用"(borrow)一个可用的keytable。如果借用失败，则会新建一个keytable。当bthread结束时，keytable会被"归还"(return)到创建它的pthread的线程本地存储中。

问题根源

问题的核心在于keytable的借用和归还机制存在以下缺陷：

调度不均衡：当bthread在执行过程中先使用keytable(如记录日志)，然后进行长时间操作(如sleep或等待锁)时，这些bthread可能会被调度到其他pthread上执行完成。这导致keytable被"归还"到错误的pthread线程本地存储中。
资源分布不均：某些pthread可能积累了大量的空闲keytable，而其他pthread则频繁需要新建keytable，导致系统整体keytable数量持续增长。
缺乏回收机制：没有对单个pthread中积累的过多空闲keytable进行回收的机制，导致内存使用量不断上升。

解决方案

针对这个问题，社区提出了以下改进方案：

引入阈值控制：为每个pthread的线程本地存储中的空闲keytable数量设置上限。当超过阈值时，将多余的keytable转移到全局空闲列表中。
优化借用逻辑：在需要新建keytable前，先检查全局空闲列表中是否有可用的keytable，避免频繁新建。
批量操作优化：对全局空闲列表的操作采用批量处理方式，减少锁竞争。

这种方案既保持了线程本地存储的性能优势，又避免了资源分布不均导致的内存泄漏问题。

实际影响

这个问题特别影响使用BRPC日志功能的场景，因为LogStream的实现依赖于bthread_keytable。当大量bthread使用日志功能时，会导致keytable数量激增，进而造成显著的内存增长。

最佳实践

对于使用BRPC的开发人员，建议：

及时升级到包含此修复的版本(1.10之后的版本)
监控bthread_keytable_count指标，及时发现类似问题
对于性能敏感的应用，可以考虑减少bthread中TLS数据的使用频率

总结

BRPC 1.10版本中引入的bthread_keytable内存泄漏问题，反映了分布式线程调度与资源管理之间的复杂关系。通过引入两级(线程本地+全局)资源管理机制，既保持了线程本地存储的性能优势，又解决了资源分布不均的问题。这种设计思路对于其他需要管理线程特定资源的系统也有很好的参考价值。

brpc is an Industrial-grade RPC framework using C++ Language, which is often used in high performance system such as Search, Storage, Machine learning, Advertisement, Recommendation etc. "brpc" means "better RPC".

项目地址：https://gitcode.com/GitHub_Trending/brpc/brpc

登录后查看全文

项目优选

收起

deepin linux kernel

Ascend Extension for PyTorch

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件，通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求，让密码技术应用更简单，同时探索后量子等先进算法创新实践，构建密码前沿技术底座！

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

昇腾LLM分布式训练框架

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

flutter_flutter