TiKV内存异常增长与OOM问题分析：高并发锁竞争场景下的挑战

2025-05-14 16:59:23作者：鲍丁臣Ursa

TiKV是一款开源的、分布式的、事务性的键值数据库，支持ACID合规的事务性API。它由Rust编写，采用Raft共识算法，最初为兼容MySQL协议的分布式HTAP数据库TiDB设计。TiKV提供地理复制、水平扩展能力，并实现了类似Google Percolator的强一致分布式事务。其特性包括：自动分片、高性能事务处理、coprocessor框架及与TiDB的无缝协作。现在，TiKV已成为云原生计算基金会的毕业项目，被广泛应用。

项目地址：https://gitcode.com/gh_mirrors/tik/tikv

背景介绍

在分布式数据库TiKV的实际运行中，我们发现了一个值得关注的内存管理问题。当系统处于特定高并发场景时，TiKV节点的内存使用量会异常快速增长，最终可能导致内存溢出（OOM）错误，影响服务的稳定性。这个问题特别容易出现在以下两种条件同时满足的情况下：

高并发锁竞争：大量事务同时尝试锁定少量键，形成较长的锁等待队列
分布式死锁检测机制：锁竞争发生在非死锁检测器（Deadlock Detector）Leader所在的TiKV节点上

问题机理分析

锁等待队列的动态变化

在TiKV的锁管理机制中，当多个事务竞争同一资源时，会形成一个等待队列。问题的核心在于当锁持有者发生变化时，系统需要更新所有等待事务的依赖关系。

考虑一个典型场景：假设有N个悲观锁请求正在等待事务A持有的锁。当A释放锁后，事务B获得了该锁。此时，原先等待A的所有N个事务现在都需要改为等待B。这种依赖关系的变更需要通知分布式死锁检测器。

通知机制的效率问题

当前实现中，每个依赖关系的变更都会触发独立的RPC通知：

每个等待事务需要发送clean_up_wait_for消息
随后发送detect消息给死锁检测器Leader

这种非批量的通知方式在高并发场景下会带来显著的性能问题。虽然批量处理在理论上可以提高效率，但由于协议复杂性的考虑，目前尚未实现这一优化。

消息积压与内存增长

当锁等待队列较长且锁获取/释放频率较高时，通知消息的生成速度可能远超发送能力。这会导致：

发送通道快速填满
待发送消息在内存中积压
内存使用量持续增长
最终可能导致OOM错误

问题复现与验证

通过特定测试可以稳定复现这一问题：

搭建至少2个TiKV节点的集群
通过placement规则确保测试表Region的Leader与第一个Region的Leader位于不同节点
运行高并发测试程序，模拟大量事务竞争少量键的场景

测试结果表明，在这种配置下，TiKV节点的内存确实会出现异常增长，验证了我们的分析。

解决方案探讨

针对这一问题，可能的解决方向包括：

批量通知机制：修改协议支持批量更新依赖关系，减少RPC次数
流量控制：实现背压机制，防止消息积压
本地缓存优化：在非Leader节点缓存部分依赖关系，减少即时通知压力
队列长度监控：对锁等待队列实施监控和告警

总结与建议

TiKV在高并发锁竞争场景下的内存管理问题揭示了分布式系统设计中的一个重要挑战：如何在保证正确性的同时兼顾性能。对于生产环境中的TiKV部署，建议：

监控锁等待队列长度和内存使用情况
在预期会有高并发锁竞争的场景下，考虑合理分片数据
关注相关修复版本的发布，及时升级

这一问题的深入分析和解决不仅有助于提升TiKV的稳定性，也为分布式系统的锁管理机制设计提供了宝贵经验。

tikv

项目地址：https://gitcode.com/gh_mirrors/tik/tikv

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

openGauss-server

openGauss kernel ~ openGauss is an open source relational database management system