Harvester项目中的单副本卷升级检测机制优化

2025-06-14 05:16:11作者：谭伦延

Harvester 是一个现代、开放、互操作的超融合基础设施（HCI）解决方案，基于 Kubernetes 构建。它为寻求云原生 HCI 解决方案的运营商提供了一个开源替代方案。Harvester 运行在裸金属服务器上，提供集成的虚拟化和分布式存储功能。除了传统的虚拟机（VM），Harvester 还通过与 Rancher 的集成支持容器化环境，统一了传统虚拟化基础设施，同时促进了从核心到边缘的容器采用。

项目地址：https://gitcode.com/gh_mirrors/har/harvester

背景与问题分析

在Harvester项目的升级过程中，我们发现现有的升级验证器仅对运行中的单副本卷进行检查。然而，对于已分离但同样配置为单副本的卷，这种情况可能导致节点排空操作被阻塞或引发数据完整性问题。

在Harvester v1.4.0版本之前，Longhorn的默认节点排空策略是"block-if-contains-last-replica"，这意味着单个副本卷会阻止节点排空操作。从v1.4.0版本开始，虽然将排空策略改为"allow-if-replica-is-stopped"解决了排空阻塞问题，但在升级过程中仍可能存在数据完整性风险。

技术解决方案

为解决这一问题，我们改进了升级检测机制，使其能够同时识别已附加和已分离的单副本卷情况。具体实现包括：

升级webhook验证器扩展检测范围，不仅检查运行中的卷，也检查所有单副本配置的卷
在升级预检查脚本中加入相关警告机制
在用户界面添加复选框选项，允许用户选择是否因单副本卷而拒绝升级

实现细节

技术实现上主要涉及两个关键修改点：

升级验证器逻辑重构，使其能够遍历所有卷而不仅限于已附加卷
新增用户界面交互元素，让管理员能够根据实际情况决定是否继续升级

技术意义

这一改进具有多重技术价值：

提高了系统升级的安全性，减少了因单副本卷导致的数据风险
增强了系统管理的灵活性，管理员可以根据业务需求选择处理方式
完善了升级前的健康检查机制，使系统状态评估更加全面

最佳实践建议

对于生产环境部署，我们建议：

对于关键业务数据卷，应始终配置多副本以提高可用性
在升级前使用预检查工具全面评估系统状态
根据业务连续性要求谨慎选择是否跳过单副本卷检查

这一改进体现了Harvester项目对数据安全和系统可靠性的持续关注，通过精细化的升级控制机制，为用户提供了更安全、更灵活的集群管理体验。

Harvester 是一个现代、开放、互操作的超融合基础设施（HCI）解决方案，基于 Kubernetes 构建。它为寻求云原生 HCI 解决方案的运营商提供了一个开源替代方案。Harvester 运行在裸金属服务器上，提供集成的虚拟化和分布式存储功能。除了传统的虚拟机（VM），Harvester 还通过与 Rancher 的集成支持容器化环境，统一了传统虚拟化基础设施，同时促进了从核心到边缘的容器采用。

项目地址：https://gitcode.com/gh_mirrors/har/harvester

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

昇腾LLM分布式训练框架

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统