Apache Horaedb中TimeMergeStorage清单文件的高效持久化方案

2025-06-28 14:21:41作者：卓炯娓

背景与问题分析

在Apache Horaedb项目中，TimeMergeStorage是一种用于时间序列数据存储的重要组件。当前实现中，当TimeMergeStorage的元信息发生变化时，系统会将新的SST文件添加到清单(manifest)中，然后将整个清单重新持久化。这种实现方式存在明显的性能瓶颈：

每次变更都需要完整重写整个清单文件，随着数据量增长，I/O开销会显著增加
清单文件体积会随着时间不断膨胀，导致持久化操作耗时增加
在高频率写入场景下，这种全量持久化方式会成为系统性能瓶颈

优化方案设计

针对上述问题，我们提出了一种增量式的清单持久化方案，核心思想是将清单文件的更新分解为两个部分：

增量更新：每次新增SST文件时，立即单独持久化该文件
定期合并：后台定期将这些增量文件合并为完整快照

具体实现架构如下：

/root/manifest/
    ├── snapshot       # 完整清单快照
    ├── new_sst_0     # 增量SST文件0
    ├── new_sst_1     # 增量SST文件1
    ├── new_sst_2     # 增量SST文件2
    └── ...           # 其他增量文件

关键技术实现

清单初始化流程

系统启动时，清单初始化过程如下：

扫描清单目录下的所有SST文件
将这些文件按创建时间排序
基于这些文件重建内存中的清单状态
如果存在快照文件，优先使用快照文件进行恢复

增量更新机制

当有新的SST文件需要添加到清单时：

立即将新SST文件单独持久化到清单目录
文件名采用递增编号方式(如new_sst_N)
同时将该文件信息添加到内存中的清单状态
计数器记录当前新增文件数量

后台合并策略

系统采用基于阈值的合并触发机制：

当新增文件数量达到预设阈值(如50个)时触发合并
后台线程扫描清单目录下的所有SST文件
将这些文件合并为一个完整的快照文件
合并完成后，可以安全删除旧的增量文件
重置新增文件计数器

方案优势分析

写入性能提升：小文件单独持久化避免了每次全量写入的开销
降低I/O压力：增量更新减少了单次写入的数据量
系统稳定性增强：即使合并过程中发生故障，也能从增量文件中恢复
资源利用率优化：后台合并减少了对前台业务的影响

实现注意事项

文件命名规范：增量文件应采用严格有序的命名方式，便于恢复时正确排序
并发控制：需要处理好清单更新与后台合并的并发访问问题
错误处理：实现完善的错误恢复机制，确保在任何步骤失败后都能保持数据一致性
配置灵活性：合并阈值应支持动态调整以适应不同负载场景

这种优化方案已在Apache Horaedb项目中实现，显著提升了TimeMergeStorage在高负载场景下的性能表现，为时间序列数据的高效存储提供了可靠保障。

登录后查看全文

项目优选

收起

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

deepin linux kernel

cann-learning-hub

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。

Jupyter Notebook

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。