YugabyteDB中TServer崩溃导致事务丢失问题分析与修复
问题背景
在YugabyteDB分布式数据库中,我们发现了一个可能导致数据不一致的关键问题。该问题最初是在CDC(变更数据捕获)与数据库克隆功能的联合测试中被发现的。测试场景中,当源数据库执行克隆操作后,CDC数据复制会出现异常,表现为源数据库和克隆数据库之间的行计数不一致且不断波动。
问题现象
在典型的测试流程中:
- 创建包含2个表的源数据库
- 在源数据库上启用CDC并部署gRPC连接器
- 克隆原始数据库
- 在克隆数据库上启用CDC并部署连接器
- 验证CDC复制正确性
测试过程中观察到源数据库的行计数出现异常波动,例如:
- 初始状态:源库行数113,659,同步正常
- 异常开始:源库行数从174,113变为154,691
- 后续发展:行数持续波动(149,448→145,923→150,355→139,732)
根本原因分析
经过深入调查,发现问题根源在于YugabyteDB的写入和刷盘机制存在缺陷。具体表现为:
-
操作顺序问题:当处理SNAPSHOT_OP(特别是删除操作)时,系统会先更新RocksDB清单文件中的flushed frontier(通过Tablet::ModifyFlushedFrontier),然后再将之前的写操作真正刷盘到SST文件。
-
崩溃恢复缺陷:如果在更新flushed frontier后、实际数据刷盘前发生TServer崩溃,重启后的tablet bootstrap过程会错误地认为这些数据已经持久化,导致部分已提交但未刷盘的事务丢失。
-
CDC影响:这种数据丢失会导致CDC流出现不一致,表现为行计数异常波动,因为部分已复制的数据在崩溃恢复后被丢弃。
技术细节
问题的核心在于YugabyteDB的持久化机制:
-
RocksDB集成:YugabyteDB使用RocksDB作为存储引擎,数据首先写入内存表(MemTable),然后异步刷盘到SST文件。
-
Frontier机制:flushed frontier记录了已持久化数据的前沿位置,用于崩溃恢复时确定需要重放的日志范围。
-
错误时序:当前实现在更新flushed frontier时没有确保相关数据已经刷盘,导致持久化状态与实际数据不一致。
解决方案
修复方案着重于保证数据持久化的原子性和正确顺序:
-
强制刷盘:修改Tablet::ModifyFlushedFrontier实现,在更新flushed frontier前,先同步刷盘常规DB和intents DB。
-
严格顺序:确保只有数据确实写入磁盘后,才更新清单文件中的flushed frontier标记。
-
崩溃安全:这种修改保证了即使TServer在更新过程中崩溃,也不会出现数据丢失,因为要么全部持久化,要么全部不持久化。
影响范围与修复版本
该问题是一个长期存在的潜在缺陷,影响多个YugabyteDB版本。修复方案已向后移植到所有受支持的稳定版本,包括2024.1、2024.2和2025.1等主要发布线。
最佳实践建议
对于使用YugabyteDB的生产环境,特别是依赖CDC或数据库克隆功能的用户,建议:
- 及时升级到包含此修复的版本
- 在关键业务场景中增加数据一致性校验
- 监控CDC延迟和一致性指标
- 考虑在重要操作前后执行手动刷盘(如通过admin命令)
该修复显著提高了YugabyteDB在崩溃恢复场景下的数据可靠性,确保了分布式事务的完整性和一致性。
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust0191
cann-learning-hubCANN 学习中心仓,支持在线互动运行、边学边练,提供教程、示例与优化方案,一站式助力昇腾开发者快速上手。Jupyter Notebook0118
Step-3.7-FlashStep-3.7-Flash是一个拥有 1980 亿参数的稀疏混合专家(MoE)视觉语言模型,由 1960 亿参数的语言主干网络和 18 亿参数的视觉编码器组合而成,具备原生图像理解能力。Python00
JoyAI-EchoJoyAI-Echo,这是一个独立的、仅用于推理的版本,旨在实现分钟级多镜头音视频生成。它采用了经过蒸馏的DMD生成器、配对的跨模态记忆以及故事级别的一致性。其性能的核心在于,一个跨模态视听记忆库能够在长达五分钟的视频中保持角色外观和语音音色的一致性。同时,一个训练后处理流程将基于记忆的强化学习与分布匹配蒸馏相结合,实现了7.5倍的速度提升,显著增强了视觉质量和对齐效果。00
fun-rec推荐系统入门教程,在线阅读地址:https://datawhalechina.github.io/fun-rec/Python03
so-large-lm大模型基础: 一文了解大模型基础知识01