Tikv中compact_log_backup的元数据过滤优化

2025-05-14 20:33:32作者：温玫谨Lighthearted

TiKV是一款开源的、分布式的、事务性的键值数据库，支持ACID合规的事务性API。它由Rust编写，采用Raft共识算法，最初为兼容MySQL协议的分布式HTAP数据库TiDB设计。TiKV提供地理复制、水平扩展能力，并实现了类似Google Percolator的强一致分布式事务。其特性包括：自动分片、高性能事务处理、coprocessor框架及与TiDB的无缝协作。现在，TiKV已成为云原生计算基金会的毕业项目，被广泛应用。

项目地址：https://gitcode.com/gh_mirrors/tik/tikv

在分布式KV存储引擎Tikv中，compact_log_backup是一个负责日志压缩和备份的关键组件。近期发现该组件在处理元数据时存在一个可以优化的点，特别是在处理被迁移删除的元数据时。

问题背景

当Tikv执行日志压缩操作时，会生成新的迁移(migration)记录来标记哪些文件已被删除。当前实现中，compact_log_backup在读取元数据时，会将这些已被迁移删除的元数据一并读取，就像是从BASE迁移获取快照一样。这种做法虽然功能上没有问题，但会导致一些不必要的压缩操作被触发。

技术细节分析

在Tikv的存储引擎设计中：

日志压缩是一个周期性执行的维护操作
每次压缩会生成迁移记录，标记被删除的文件
当前的元数据读取逻辑没有过滤这些已被删除的元数据
这会导致系统误认为这些文件仍然存在，从而触发额外的压缩

优化方案

我们可以改进元数据读取逻辑，使其能够识别并过滤掉那些已被迁移删除的元数据。具体实现上：

在读取元数据时，检查每条记录的状态
对于标记为已删除的元数据，直接跳过不处理
只保留有效的、未被删除的元数据进行后续处理

这种优化将带来以下好处：

减少不必要的压缩操作
降低系统资源消耗
提高整体性能

实现考虑

在实际实现时需要注意：

需要确保过滤逻辑的正确性，避免误删有效数据
要考虑与现有压缩机制的兼容性
需要添加相应的测试用例验证新逻辑
可能需要调整相关的监控指标

总结

通过对compact_log_backup组件中元数据处理逻辑的优化，Tikv可以更高效地管理存储空间，减少不必要的压缩操作。这种优化虽然看似微小，但在大规模部署环境下，能够显著降低系统开销，提升整体性能。这也体现了Tikv团队对系统细节持续优化的追求。

tikv

项目地址：https://gitcode.com/gh_mirrors/tik/tikv

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

leetcode

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.37 K

781

Tikv中compact_log_backup的元数据过滤优化

问题背景

技术细节分析

优化方案

实现考虑

总结

热门内容推荐

最新内容推荐

项目优选

Tikv中compact_log_backup的元数据过滤优化

问题背景

技术细节分析

优化方案

实现考虑

总结

相关内容推荐

热门内容推荐

最新内容推荐

项目优选