Harvester项目升级过程中Rancher组件版本兼容性问题分析

2025-06-14 08:00:55作者：江焘钦

Open source hyperconverged infrastructure (HCI) software

项目地址：https://gitcode.com/gh_mirrors/ha/harvester

问题背景

在Harvester 1.5.0版本升级过程中，开发团队发现从1.5.0-rc2版本升级到master-head版本时，系统会在升级Rancher组件时卡住。这一现象引起了团队的重视，因为Rancher作为Harvester的核心组件之一，其升级稳定性直接影响整个系统的可用性。

问题现象

具体表现为升级过程在等待Rancher依赖的Helm release时停滞，特别是fleet组件的升级。日志显示系统在等待"fleet-106.0.0+up0.12.0"部署完成时被阻塞。有趣的是，从1.4.2版本直接升级到master-head版本却能顺利完成，这表明问题与特定版本间的升级路径有关。

深入分析

通过详细日志分析和技术调查，团队发现了几个关键点：

版本标识问题：Rancher v2.11.0的系统代理安装器镜像中打包的并非标准的v2.11.0版本，而是带有"dirty"标记的开发版本。这可能导致版本检测和升级逻辑出现偏差。
RC版本升级机制缺陷：当从RC(Release Candidate)版本升级时，Rancher的内部升级逻辑存在缺陷。调试日志显示，系统错误地认为当前RC版本(106.0.0+up0.12.0-rc.3)已经满足或高于要求的最小版本(106.0.0+up0.12.0)，因此跳过了必要的升级步骤。
配置缺失：在升级过程中，Rancher Pod日志显示无法找到必要的ConfigMap，这进一步阻碍了升级流程的完成。

解决方案与验证

团队经过多次测试验证，确定了以下解决方案：

直接升级路径：确认从1.4.2稳定版直接升级到1.5.0 master-head版本是可行的，这为生产环境提供了安全的升级路径。
手动干预方案：对于已经卡在升级过程中的系统，提供了手动升级相关组件的详细步骤，包括获取正确的Helm chart和配置值，然后执行手动升级。
长期修复：团队已经向Rancher上游提交了相关问题，从根本上解决RC版本升级机制的问题。

经验总结

这次事件为Harvester项目提供了宝贵的经验：

版本管理：需要更加严格的版本控制和发布流程，特别是RC版本与正式版本之间的区别应当更加明确。
升级路径测试：应当覆盖所有可能的升级路径，包括从RC到正式版的升级场景。
依赖组件协调：对于关键依赖组件如Rancher的升级，需要更深入的集成测试和故障处理方案。
监控与调试：在升级过程中增强调试能力，如启用Rancher的debug模式，可以更快定位问题。

结论

通过这次问题的分析和解决，Harvester团队不仅解决了当前的升级阻塞问题，还建立了更完善的版本管理和升级验证机制。这为未来版本的平滑升级奠定了坚实基础，同时也提醒开发者在依赖组件升级时需要更加谨慎和全面的测试。

Open source hyperconverged infrastructure (HCI) software

项目地址：https://gitcode.com/gh_mirrors/ha/harvester

登录后查看全文

热门内容推荐

1 【亲测免费】开源项目 `build-your-own-x` 使用指南 2 【亲测免费】探索科技之旅：《Build Your Own X》项目详解 3 GitHub_Trending/bu/build-your-own-x自动化：CI/CD流程在自制项目中的应用 4 从零打造智能家居系统：用build-your-own-x实现家庭自动化

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

昇腾LLM分布式训练框架

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统