Tarantool项目中Vinyl引擎内存泄漏问题分析
2025-06-24 00:13:26作者:虞亚竹Luna
问题背景
在Tarantool数据库项目的测试过程中,发现Vinyl存储引擎存在内存泄漏问题。该问题在运行特定测试用例时被AddressSanitizer工具检测到,表现为间接泄漏4字节内存。
问题现象
测试人员在执行replication/prune.test.lua测试用例时,发现Vinyl实例因SIGSEGV信号终止。进一步分析日志发现,在测试过程中存在内存泄漏:
Indirect leak of 4 byte(s) in 1 object(s) allocated from:
#0 0x562a6a9a0c89 in calloc
#1 0x562a6acab2bc in vy_page_new
#2 0x562a6acb9f6b in vy_slice_stream_read_page
#3 0x562a6acb7c4b in vy_slice_stream_search
...
SUMMARY: AddressSanitizer: 1059 byte(s) leaked in 3 allocation(s).
技术分析
泄漏根源
经过深入分析,发现内存泄漏发生在Vinyl引擎的页面处理流程中。具体来说,当vy_slice_stream_search()函数调用vy_page_find_key()失败时,未能正确释放之前分配的页面内存。
相关代码路径
vy_page_new()函数在src/box/vy_run.c中分配新页面内存vy_slice_stream_read_page()函数读取页面数据vy_slice_stream_search()函数执行搜索操作- 当搜索失败时,缺少对已分配页面的释放操作
问题复现
开发者提供了简化的复现方法:
yes gh-4864 | head -n50 | xargs ./test-run.py --builddir ../build/debug-asan
这可以稳定重现内存泄漏问题,验证了问题的存在。
影响范围
该内存泄漏问题影响以下Tarantool版本:
- 2.11.x系列
- 3.2.x系列
- 3.3.x系列
解决方案
修复方案相对直接:在vy_slice_stream_search()函数的错误处理路径中添加对vy_page_delete()的调用,确保在搜索失败时正确释放已分配的页面内存。
技术意义
虽然泄漏量不大(仅4字节),但在数据库系统中,任何内存泄漏都可能随着系统长时间运行而累积,最终导致内存耗尽。特别是对于Vinyl这样的LSM-tree存储引擎,频繁的页面分配和释放是其核心操作之一,确保内存管理的正确性至关重要。
经验教训
- 错误处理路径中的资源释放容易被忽视,需要特别关注
- 自动化测试工具(如AddressSanitizer)对于发现内存问题非常有效
- 即使是小量内存泄漏也不应忽视,特别是在数据库核心组件中
这个问题也提醒开发者在编写错误处理代码时,需要全面考虑所有已分配资源的释放,确保程序的健壮性。
登录后查看全文
热门项目推荐
相关项目推荐
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust0214
cann-learning-hubCANN 学习中心仓,支持在线互动运行、边学边练,提供教程、示例与优化方案,一站式助力昇腾开发者快速上手。Jupyter Notebook0138
uni-appA cross-platform framework using Vue.jsJavaScript08
GLM-5.2智谱开源 GLM-5.2,这是针对长文本任务的最新旗舰模型。相较于前代产品 GLM-5.1,它在长文本任务处理能力上实现了显著飞跃,并且首次在稳定的 100 万 token 上下文中提供这一能力。Jinja00
SwanLab⚡️SwanLab - an open-source, modern-design AI training tracking and visualization tool. Supports Cloud / Self-hosted use. Integrated with PyTorch / Transformers / LLaMA Factory / veRL/ Swift / Ultralytics / MMEngine / Keras etc.Python00
tiny-universe《大模型白盒子构建指南》:一个全手搓的Tiny-UniverseJupyter Notebook03
项目优选
收起
deepin linux kernel
C
32
16
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
469
465
暂无描述
Dockerfile
778
5.08 K
本项目是CANN提供的transformer类大模型算子库,实现网络在NPU上加速计算。
C++
877
2.03 K
Ascend Extension for PyTorch
Python
758
968
本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。
C++
697
1.4 K
昇腾LLM分布式训练框架
Python
185
231
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
1.1 K
1.14 K
本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本,由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用,3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。
Dart
1.04 K
271
JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent,它能够将大语言模型的强大能力,通过你日常使用的各类通讯应用,直接延伸至你的指尖。
Python
2.25 K
677