Harvester虚拟机备份恢复中的存储类同步问题解析

2025-06-14 22:28:08作者：吴年前Myrtle

Open source hyperconverged infrastructure (HCI) software

项目地址：https://gitcode.com/gh_mirrors/ha/harvester

在Harvester虚拟化管理平台的使用过程中，用户可能会遇到从1.3.1版本升级到1.4.0版本时虚拟机备份恢复失败的问题。本文将深入分析该问题的技术背景、产生原因以及解决方案。

问题背景

当用户尝试在两个不同版本的Harvester集群之间迁移虚拟机时，即使使用了相同的S3备份存储位置，恢复操作也可能失败。特别是在以下场景中：

原始集群运行Harvester 1.3.1版本
新集群运行Harvester 1.4.0版本
使用相同的云镜像文件（如Ubuntu云镜像）
通过相同的S3备份目标进行数据迁移

根本原因分析

该问题的核心在于Harvester 1.3.x版本中虚拟机镜像(VMImage)的存储类(StorageClass)管理机制存在局限性：

镜像与存储类关联性：每个虚拟机镜像在创建时会自动生成一个特定的存储类，其命名格式为"longhorn-image-xxxxx"。
版本间差异：
- 1.3.x版本不包含将VMImage同步到备份目标的功能
- 1.4.0版本虽然增加了VMImage的备份功能，但初始版本中缺少自动刷新机制
命名不一致问题：即使手动上传了相同内容的镜像文件，新集群生成的存储类名称也会与原始集群不同，导致备份系统无法正确关联。

解决方案

对于使用1.3.x版本的用户，需要采取以下手动操作步骤：

镜像准备：
- 确保使用完全相同版本的云镜像文件
- 校验文件的MD5/SHA等哈希值是否一致
- 在新集群中创建镜像时使用与原始集群相同的名称
存储类处理：
- 识别新集群自动生成的存储类名称（如longhorn-image-6drb9）
- 手动创建克隆，使用原始存储类名称（如longhorn-image-vg72q）
备份恢复：
- 完成上述操作后，备份才会出现在虚拟机的备份列表中
- 此时可正常执行恢复操作

最佳实践建议

镜像管理：
- 避免使用"latest"等非固定版本的镜像
- 建议使用具体版本号的镜像文件（如ubuntu-23.04而非ubuntu-latest）
版本升级：
- 1.4.0版本已改进VMImage的备份功能
- 1.5.0版本将增加自动刷新机制（refreshIntervalInSeconds）
文档参考：
- 操作前详细阅读官方文档中的备份恢复章节
- 特别注意版本差异带来的特殊处理要求

技术展望

随着Harvester的持续发展，虚拟机迁移体验正在不断改善。1.4.0版本已经实现了VMImage的自动备份，而1.5.0版本将引入自动刷新机制，这将大大简化跨集群迁移的操作流程。建议用户根据业务需求合理安排升级计划，以获得更完善的功能体验。

Open source hyperconverged infrastructure (HCI) software

项目地址：https://gitcode.com/gh_mirrors/ha/harvester

登录后查看全文

项目优选

收起

deepin linux kernel

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

昇腾LLM分布式训练框架

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。