Harvester项目中Rancher升级问题的技术分析与解决方案

2025-06-14 17:26:24作者：牧宁李

Harvester 是一个现代、开放、互操作的超融合基础设施（HCI）解决方案，基于 Kubernetes 构建。它为寻求云原生 HCI 解决方案的运营商提供了一个开源替代方案。Harvester 运行在裸金属服务器上，提供集成的虚拟化和分布式存储功能。除了传统的虚拟机（VM），Harvester 还通过与 Rancher 的集成支持容器化环境，统一了传统虚拟化基础设施，同时促进了从核心到边缘的容器采用。

项目地址：https://gitcode.com/gh_mirrors/har/harvester

问题背景

在Harvester v1.5.0版本升级过程中，开发团队发现从v1.5.0-rc2升级到master-head版本时，系统会在升级清单(upgrade_manifest)阶段卡住。这个问题特别出现在Rancher版本升级到v2.11.0的过程中。

问题现象

升级过程主要卡在等待Rancher依赖的Helm发布阶段，特别是fleet组件的部署。日志显示系统持续等待"fleet-106.0.0+up0.12.0"版本的部署完成，但实际上系统已经安装了"fleet-106.0.0+up0.12.0-rc.3"版本。

根本原因分析

经过深入排查，发现问题的核心在于Rancher对基于RC(Release Candidate)版本的升级处理不够完善。具体表现为：

当系统检测到当前已安装的RC版本(106.0.0+up0.12.0-rc.3)在数值上"大于或等于"目标稳定版本(106.0.0+up0.12.0)时，Rancher会跳过实际的升级操作。
这种版本比较逻辑导致升级流程无法正常推进，因为Harvester的升级控制器仍在等待预期的稳定版本部署完成。
从v1.4.2直接升级到v1.5.0-master-head却能成功，因为这是从稳定版本升级，不涉及RC版本的特殊处理。

解决方案

对于遇到此问题的用户，可以采用以下两种解决方案：

临时解决方案（手动升级）

手动下载并安装所需的Helm chart：

helm pull https://charts.rancher.io/assets/fleet/fleet-106.0.0+up0.12.0.tgz
helm get values fleet -n cattle-fleet-system -o yaml > values.yaml
helm upgrade fleet ./fleet-106.0.0+up0.12.0.tgz --namespace cattle-fleet-system -f values.yaml --wait

对fleet-crd执行类似操作：

helm pull https://charts.rancher.io/assets/fleet-crd/fleet-crd-106.0.0+up0.12.0.tgz
helm get values fleet-crd -n cattle-fleet-system -o yaml > values.yaml
helm upgrade fleet-crd ./fleet-crd-106.0.0+up0.12.0.tgz --namespace cattle-fleet-system -f values.yaml --wait

对rancher-webhook执行升级：

helm pull https://charts.rancher.io/assets/rancher-webhook/rancher-webhook-106.0.0+up0.7.0.tgz
helm get values rancher-webhook -n cattle-system -o yaml > values.yaml
helm upgrade rancher-webhook ./rancher-webhook-106.0.0+up0.7.0.tgz --namespace cattle-system -f values.yaml

长期解决方案

等待Rancher官方修复RC版本升级逻辑的问题。
在生产环境中，建议避免从RC版本直接升级，而是等待稳定版本发布后再执行升级操作。
如果必须从RC版本升级，可以考虑先回退到上一个稳定版本，再升级到目标版本。

技术建议

在升级前，务必检查当前安装的Rancher和组件版本，特别是注意是否有RC版本存在。
对于关键生产环境，建议先在测试环境中验证升级流程。
升级过程中启用Rancher的调试模式可以帮助诊断问题：

kubectl edit deployment -n cattle-system rancher

在容器参数中添加"--debug=true"选项。

监控升级日志，特别关注Helm chart版本比较相关的信息。

总结

Harvester项目中遇到的这个Rancher升级问题，揭示了版本控制系统在处理RC版本时的一个潜在缺陷。开发团队已经确认在最新版本中此问题已得到解决，但对于仍在使用RC版本的用户，可以采用文中提供的解决方案。这提醒我们在软件生命周期管理中，需要特别注意预发布版本与稳定版本之间的升级路径设计。

harvester

项目地址：https://gitcode.com/gh_mirrors/har/harvester

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

leetcode

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.37 K

781

Harvester项目中Rancher升级问题的技术分析与解决方案

问题背景

问题现象

根本原因分析

解决方案

临时解决方案（手动升级）

长期解决方案

技术建议

总结

热门内容推荐

最新内容推荐

项目优选

Harvester项目中Rancher升级问题的技术分析与解决方案

问题背景

问题现象

根本原因分析

解决方案

临时解决方案（手动升级）

长期解决方案

技术建议

总结

相关内容推荐

热门内容推荐

最新内容推荐

项目优选