Apache Pegasus 大规模数据导入中的内存管理问题分析

2025-07-06 17:37:46作者：郦嵘贵Just

问题背景

Apache Pegasus 是一个分布式键值存储系统，其批量数据导入（bulkload）功能是用户常用的数据迁移手段。然而在实际生产环境中，我们发现了批量导入过程中存在严重的内存管理问题，可能导致集群节点大规模崩溃。

问题现象

在批量导入的数据文件下载阶段，当出现以下两种场景时，会导致集群中多个节点崩溃：

节点重启场景：在批量导入过程中重启任意一个节点，可能引发整个集群节点崩溃
文件缺失场景：当批量导入所需的SST文件缺失时，同样会导致多个节点崩溃

崩溃日志显示存在三种不同类型的堆栈信息，但都与内存管理相关，特别是tcmalloc报告了large alloc 2560917504等异常信息。

根本原因分析

经过深入分析，发现问题根源在于clear_bulk_load_states函数执行后，download_sst_file任务仍然继续运行，导致内存访问异常。

节点重启场景分析

当节点重启时，会发生以下关键事件序列：

节点重启导致ballot值增加
系统调用clear_bulk_load_states_if_needed()清除副本的_metadata.files
但原有的download_sst_file任务仍在执行，尝试访问已被清除的元数据

文件缺失场景分析

当批量导入文件缺失时，问题更为复杂：

主副本下载失败并停止所有SST文件下载
元数据服务仍指示继续下载
主副本向元数据报告下载进度
元数据服务最终指示停止下载并清除_metadata.files
但下载任务未被正确终止，继续尝试访问已清除的元数据

技术细节剖析

问题的核心在于download_sst_file函数中访问_metadata.files的方式：

const file_meta &f_meta = _metadata.files[file_index];
const std::string &file_name = utils::filesystem::path_combine(local_dir, f_meta.name);

当_metadata.files被清除后，f_meta.name可能指向无效内存或包含极长字符串，导致：

路径长度超过系统限制（日志显示有的路径长度达到410828079字节）
tcmalloc报告大内存分配异常
最终触发断言失败或内存访问违例

解决方案建议

针对这一问题，建议从以下几个方面进行修复：

任务取消机制：在清除批量导入状态时，必须确保所有相关的下载任务被正确取消
内存访问保护：对_metadata.files的访问应增加有效性检查
路径长度限制：在文件系统操作前增加路径长度验证
错误处理增强：完善下载过程中的错误处理逻辑，确保异常情况能够被优雅处理

经验总结

这一问题的发现和处理过程为我们提供了宝贵的经验：

分布式系统状态一致性：在分布式环境中，任何状态变更都必须考虑其对并发操作的影响
资源清理完整性：资源清理操作必须确保所有相关任务都被正确处理
防御性编程：对关键数据结构的访问必须进行有效性验证
系统健壮性：系统应设计为能够优雅处理各种异常情况，而非直接崩溃

通过解决这一问题，可以显著提升Apache Pegasus在大规模数据导入场景下的稳定性和可靠性。

incubator-pegasus

Apache Pegasus - A horizontally scalable, strongly consistent and high-performance key-value store

项目地址：https://gitcode.com/gh_mirrors/incu/incubator-pegasus

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解