Harvester 1.4.2升级至1.5.0的常见问题分析与解决方案

2025-06-13 10:57:00作者：胡唯隽

升级失败现象分析

在将Harvester从1.4.2版本升级至1.5.0版本的过程中，用户遇到了升级流程中断的问题。系统虽然连接了互联网，但出现了类似ImagePullBackOff的错误症状。检查升级日志pod时发现没有相关pod被列出，即使应用了kubectl补丁操作，系统也未能恢复正常。

通过对支持包的深入分析，发现系统中残留了多个先前升级尝试留下的日志资源，这些残留资源阻碍了新升级流程的正常启动和完成。具体表现为：

系统中存在两个陈旧的Logging CR资源：
- hvst-upgrade-5554f-upgradelog-infra（存在96天）
- hvst-upgrade-swx5p-upgradelog-operator-root（存在94天）
多个关联的pod仍在运行，包括：
- 多个fluentbit实例
- fluentd实例
- rancher-logging组件

这些残留资源占用了系统资源并可能造成资源冲突，导致新升级流程无法正常启动。

删除陈旧的Logging CR资源：

kubectl delete logging hvst-upgrade-5554f-upgradelog-infra
kubectl delete logging hvst-upgrade-swx5p-upgradelog-operator-root

检查并清理相关pod：
```
kubectl get pods -A | grep hvst-upgrade
```
确认只保留必要的pod（如rancher-logging组件），删除其他残留pod。

通过以上步骤，大多数升级中断问题可以得到解决。如问题仍然存在，建议收集完整的支持包并联系技术支持团队进行深入分析。

登录后查看全文