Longhorn系统备份恢复中的数据保留问题分析

2025-06-02 12:23:27作者：齐添朝

问题背景

在Longhorn分布式存储系统的测试过程中，发现了一个关于系统备份恢复的重要问题：当用户创建系统备份后，在恢复过程中，卷数据未能正确保留。具体表现为，在系统备份创建前写入的10MB数据，在系统恢复后无法在卷中找到。

问题现象

测试人员按照标准流程进行了以下操作：

设置了默认备份目标和额外备份目标
创建了两个卷(vol-a和vol-b)
向两个卷各写入10MB数据
创建系统备份
删除额外备份目标
恢复系统备份

恢复后发现，虽然备份操作显示成功，但卷中先前写入的数据却丢失了。值得注意的是，这个问题在v1.7.2版本中并不存在，而是在v1.8.x版本中新出现的。

技术分析

经过深入调查，开发团队发现这个问题可能与系统备份控制器中的竞态条件有关。具体来说，当系统备份控制器创建卷备份时，卷的lastBackup字段更新可能存在时序问题。在v1.8.x版本中引入的代码变更可能无意中影响了这一行为。

在正常情况下，系统备份应该捕获卷的完整状态，包括数据和元数据。但在出现问题的版本中，系统备份可能在卷的lastBackup字段完成更新前就完成了备份操作，导致恢复时无法正确引用最新的备份数据。

解决方案

开发团队通过修改系统备份控制器的逻辑解决了这个问题。主要改进包括：

确保卷备份操作完成后才进行系统备份
增加对lastBackup字段状态的检查
优化备份操作的时序控制

这些修改确保了系统备份能够正确捕获卷的最新状态，包括所有待备份的数据。

验证结果

修复后的版本(v1.8.x-head和master-head)经过严格测试，确认问题已解决。测试人员按照相同的步骤验证，确认系统恢复后卷中的数据能够正确保留。写入的10MB数据在恢复后可以正常访问，备份目标也能正确恢复。

最佳实践建议

对于使用Longhorn系统备份功能的用户，建议：

在创建系统备份前，确保所有卷备份操作已完成
定期验证备份的完整性
在重要操作前检查Longhorn版本是否包含此修复
考虑在非生产环境先测试备份恢复流程

这个问题提醒我们，在分布式存储系统中，数据一致性保障需要细致的时序控制和状态检查，特别是在涉及多组件协作的备份恢复场景中。Longhorn团队通过快速响应和修复，再次展现了其对数据可靠性的承诺。

longhorn

项目地址：https://gitcode.com/gh_mirrors/lo/longhorn

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

338

185

agent-studio

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

openGauss kernel ~ openGauss is an open source relational database management system

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.35 K

758

Longhorn系统备份恢复中的数据保留问题分析

问题背景

问题现象

技术分析

解决方案

验证结果

最佳实践建议

热门内容推荐

最新内容推荐

项目优选

Longhorn系统备份恢复中的数据保留问题分析

问题背景

问题现象

技术分析

解决方案

验证结果

最佳实践建议

相关内容推荐

热门内容推荐

最新内容推荐

项目优选