Tikv日志备份中Observer丢失Region观察的问题分析

2025-05-14 14:54:25作者：昌雅子Ethen

TiKV是一款开源的、分布式的、事务性的键值数据库，支持ACID合规的事务性API。它由Rust编写，采用Raft共识算法，最初为兼容MySQL协议的分布式HTAP数据库TiDB设计。TiKV提供地理复制、水平扩展能力，并实现了类似Google Percolator的强一致分布式事务。其特性包括：自动分片、高性能事务处理、coprocessor框架及与TiDB的无缝协作。现在，TiKV已成为云原生计算基金会的毕业项目，被广泛应用。

项目地址：https://gitcode.com/gh_mirrors/tik/tikv

问题背景

在分布式数据库Tikv的日志备份功能中，Observer模块负责监控特定Region的数据变更。当Region发生领导者变更时，Observer需要相应地调整其观察状态。然而，在某些特定时序下，Observer可能会意外丢失对某个Region的观察，导致数据备份不完整。

问题现象

当一个新的日志备份任务初始化时，如果恰好遇到Region正在进行领导者选举，就可能出现Observer丢失观察的情况。具体表现为Observer收到"stale observe id"错误，表明它收到了一个过期的观察ID请求。

技术原理

Tikv的日志备份机制依赖于Observer模块对Region变更的持续监控。每个Observer维护一个当前观察ID，只有匹配当前ID的请求才会被处理。Region在领导者选举过程中会经历多个状态变化：

Pre-candidate状态
Candidate状态
Leader状态

每个状态变化都会触发Observer的状态更新请求。这些请求通过调度器队列进行处理，但由于网络延迟和调度顺序，可能出现请求乱序到达的情况。

问题复现过程

新日志备份任务初始化，开始注册需要观察的Region范围
Region进入Pre-candidate状态，触发发送Stop观察请求
Region进入Candidate状态，再次触发发送Stop观察请求
Region成为Leader，触发发送Start观察请求(带新ID)
备份初始化扫描发现该Region，发送另一个Start观察请求(带不同ID)
由于调度器队列的FIFO特性，请求按以下顺序被处理：
- 备份初始化的Start请求
- Pre-candidate的Stop请求
- Candidate的Stop请求
- Leader选举成功的Start请求

这种处理顺序导致Observer最终收到一个与当前观察ID不匹配的请求，从而拒绝处理并丢失对该Region的观察。

解决方案

要解决这个问题，可以考虑以下几种方法：

请求去重：对于同一个Region的连续Stop请求，可以只保留最后一个
ID生成机制改进：确保备份初始化扫描和领导者选举使用相同的ID生成逻辑
状态机设计：在Observer中实现更完善的状态机，能够正确处理中间状态
请求优先级调整：让领导者选举相关的观察请求具有更高优先级

影响范围

该问题会影响Tikv的日志备份功能，可能导致部分Region的数据变更没有被正确备份。对于依赖完整日志备份进行数据恢复的场景，这可能造成数据丢失风险。

最佳实践建议

监控日志备份任务的完整性，设置适当的告警机制
定期验证备份数据的完整性
在重要操作前，检查备份系统状态
考虑实现备份数据的校验机制

通过理解这个问题背后的机制，用户可以更好地配置和使用Tikv的日志备份功能，确保数据安全性和系统可靠性。

TiKV是一款开源的、分布式的、事务性的键值数据库，支持ACID合规的事务性API。它由Rust编写，采用Raft共识算法，最初为兼容MySQL协议的分布式HTAP数据库TiDB设计。TiKV提供地理复制、水平扩展能力，并实现了类似Google Percolator的强一致分布式事务。其特性包括：自动分片、高性能事务处理、coprocessor框架及与TiDB的无缝协作。现在，TiKV已成为云原生计算基金会的毕业项目，被广泛应用。

项目地址：https://gitcode.com/gh_mirrors/tik/tikv

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

flutter_flutter

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理