Tikv内存引擎Prop测试失败问题分析

2025-05-14 08:15:44作者：申梦珏Efrain

TiKV是一款开源的、分布式的、事务性的键值数据库，支持ACID合规的事务性API。它由Rust编写，采用Raft共识算法，最初为兼容MySQL协议的分布式HTAP数据库TiDB设计。TiKV提供地理复制、水平扩展能力，并实现了类似Google Percolator的强一致分布式事务。其特性包括：自动分片、高性能事务处理、coprocessor框架及与TiDB的无缝协作。现在，TiKV已成为云原生计算基金会的毕业项目，被广泛应用。

项目地址：https://gitcode.com/gh_mirrors/tik/tikv

在PingCAP分布式KV存储引擎Tikv的开发过程中，我们发现了一个由Prop测试工具生成的测试用例失败问题。这个问题涉及到内存引擎的核心功能，值得深入分析其背后的技术原因。

问题现象

测试用例模拟了三个连续操作：

执行Put操作，写入键值对(E2, 38CC98E09D9CB1D1)
执行DeleteRange操作，删除键范围(43AC4C5F7A16505B33EE3F, E2)
执行Scan操作，从键2C0F698A开始扫描3条记录

测试在比较RocksDB和内存引擎(SkipList)的行为时出现了不一致，表明内存引擎的实现可能存在边界条件处理问题。

技术背景

Tikv的内存引擎使用SkipList数据结构作为其核心存储结构，需要与RocksDB保持行为一致性。DeleteRange操作是分布式系统中常见的操作，它需要高效地删除一个键范围内的所有数据。

问题分析

从测试用例可以看出几个关键点：

键编码问题：测试使用了十六进制编码的键，这些键长度不一致，从2字节到11字节不等，测试了引擎对变长键的处理能力。
范围删除边界：DeleteRange操作的结束键正好是之前Put操作的键(E2)，这测试了范围删除的边界条件处理。
操作序列：Put后立即执行DeleteRange，然后进行Scan，验证了操作的原子性和可见性。

可能的问题原因包括：

范围删除操作可能没有正确处理边界键
SkipList在删除范围时可能没有完全清除指定范围内的节点
内存引擎与RocksDB在范围删除的语义上存在差异

解决方案

解决此类问题需要：

仔细检查SkipList的范围删除实现，确保它正确包含/排除边界键
验证内存引擎的事务隔离级别实现，确保操作后的Scan能看到正确的数据状态
增加更多边界条件的测试用例，特别是针对变长键和范围操作的交界处

总结

这个测试失败揭示了内存引擎在复杂操作序列下可能存在的边界条件问题。通过分析这类失败案例，我们可以持续改进Tikv的内存引擎，确保其在各种极端情况下都能保持与RocksDB一致的行为，为上层提供可靠的存储服务。

tikv

项目地址：https://gitcode.com/gh_mirrors/tik/tikv

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统