Harvester升级故障排查指南：从1.4.2升级至1.5.0的常见问题分析

2025-06-13 22:39:33作者：邓越浪Henry

在将Harvester集群从1.4.2版本升级至1.5.0版本的过程中，部分用户可能会遇到升级失败的情况。本文将从技术角度深入分析这一问题的根源，并提供详细的解决方案。

问题现象分析

当执行1.4.2到1.5.0的升级操作时，系统可能会出现以下异常表现：

升级过程意外中断，无法继续
升级日志记录功能异常
相关Pod状态异常
升级按钮消失或不可用

根本原因

经过深入分析，我们发现这些问题主要由以下因素导致：

残留的升级日志资源：之前的升级操作可能未完全清理，导致系统中残留了旧的Logging CR（Custom Resource）资源
资源冲突：旧的日志记录组件与新版本组件产生资源冲突
状态不一致：集群状态未正确回滚到可升级状态

详细解决方案

第一步：检查残留资源

使用以下命令检查系统中是否存在残留的升级日志资源：

kubectl get loggings

正常情况下，该命令不应返回任何结果。如果发现有类似"hvst-upgrade--upgradelog-"的资源，则表明存在残留。

第二步：清理残留资源

对于发现的每个残留Logging CR，执行删除操作：

kubectl delete logging <logging-name>

第三步：验证Pod状态

检查系统中是否还存在与升级相关的Pod：

kubectl get pods -A | grep hvst-upgrade

理想情况下，系统中应该只保留"hvst-upgrade--upgradelog-operator-rancher-logging-"这一个Pod。如果发现其他相关Pod，也需要进行清理。

第四步：重新尝试升级

完成上述清理工作后，可以重新尝试升级操作。建议按照以下步骤进行：

确保集群网络连接正常
重新应用1.5.0版本的manifest
在UI中点击升级按钮
监控升级过程

预防措施

为了避免类似问题再次发生，建议：

在每次升级前，确保之前的升级操作已完全完成或已正确回滚
定期检查系统中的CR资源状态
升级过程中密切监控日志输出
考虑在非生产环境先进行测试升级

技术原理深入

Harvester的升级机制依赖于Kubernetes的Operator模式。升级过程中会创建多个CRD（Custom Resource Definition）资源来管理升级状态。当这些资源没有正确清理时，会导致后续升级操作失败。

日志记录组件作为升级过程的重要部分，其异常状态会直接影响整个升级流程。因此，确保日志相关资源的正确性至关重要。

总结

Harvester的版本升级是一个复杂的过程，涉及多个组件的协同工作。通过本文提供的解决方案，用户可以有效地解决1.4.2升级至1.5.0过程中遇到的各类问题。建议用户在操作前充分理解系统原理，并在必要时寻求专业技术支持。

对于更复杂的情况，建议收集完整的支持包（support bundle）并提交给开发团队进行深入分析。这有助于更快地定位问题根源并获得针对性的解决方案。

harvester

Open source hyperconverged infrastructure (HCI) software

项目地址：https://gitcode.com/gh_mirrors/ha/harvester

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

360

229

leetcode

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Harvester升级故障排查指南：从1.4.2升级至1.5.0的常见问题分析

问题现象分析

根本原因

详细解决方案

第一步：检查残留资源

第二步：清理残留资源

第三步：验证Pod状态

第四步：重新尝试升级

预防措施

技术原理深入

总结

热门内容推荐

最新内容推荐

项目优选

Harvester升级故障排查指南：从1.4.2升级至1.5.0的常见问题分析

问题现象分析

根本原因

详细解决方案

第一步：检查残留资源

第二步：清理残留资源

第三步：验证Pod状态

第四步：重新尝试升级

预防措施

技术原理深入

总结

相关内容推荐

热门内容推荐

最新内容推荐

项目优选