Harvester项目升级失败问题分析：managed chart状态异常处理方案

2025-06-14 12:33:35作者：伍霜盼Ellen

问题背景

在Harvester 1.4.0版本升级至1.4.1的过程中，部分用户遇到了升级阻断问题。系统提示"admission webhook validator.harvesterhci.io denied the request: managed chart harvester is not ready"错误，导致升级流程无法继续。该问题通常与系统组件的资源状态异常有关，需要技术人员进行手动干预。

问题本质分析

该问题的核心在于Harvester的managed chart状态监控机制。系统在升级前会检查所有托管图表(managed chart)的就绪状态，当检测到以下异常情况时会阻止升级：

网络Webhook控制器资源限制变更：用户可能因OOM问题调整了harvester-network-webhook的内存限制，导致系统检测到配置漂移
Windows系统代理计划配置不一致：system-agent-upgrader-windows Plan中的securityContext配置与预期状态不符

解决方案详解

网络Webhook控制器恢复

对于网络控制器的资源限制修改，可以通过以下两种方式处理：

恢复默认配置：

kubectl edit deployment -n harvester-system harvester-network-webhook

将资源限制恢复为原始值：

resources:
  limits:
    cpu: 200m
    memory: 256Mi
  requests:
    cpu: 10m
    memory: 64Mi

配置差异忽略（高级用法）：在fleet-local命名空间下编辑harvester ManagedChart，添加diff.comparePatches配置忽略该变更。

Windows系统代理计划修复

对于system-agent-upgrader-windows Plan的配置异常，需要确保其包含正确的securityContext配置：

kubectl edit plan -n cattle-system system-agent-upgrader-windows

确认或添加以下配置：

spec:
  upgrade:
    securityContext:
      windowsOptions:
        hostProcess: true
        runAsUserName: NT AUTHORITY\SYSTEM

问题预防建议

组件监控：定期检查所有managed chart的就绪状态

kubectl get bundle -A

变更管理：对系统核心组件进行配置变更时，建议：
- 记录所有变更内容
- 评估变更对系统升级流程的影响
- 考虑通过官方支持的配置方式而非直接修改资源
升级前检查：执行升级前运行预检命令

kubectl get bundledeployment -A

技术原理深入

Harvester使用Fleet管理系统组件，通过Bundle和BundleDeployment资源实现配置的声明式管理。当实际资源状态与声明状态不一致时，系统会标记为"Modified"状态。升级流程中的验证钩子(admission webhook)会检查这些状态，确保系统处于已知的良好状态时才允许升级。

对于Windows相关的Plan资源，其securityContext配置是确保Windows节点上agent正确运行的关键。hostProcess: true和特定的runAsUserName是Windows容器特有的配置要求，缺失这些配置会导致系统认为组件未就绪。

登录后查看全文

Harvester项目升级失败问题分析：managed chart状态异常处理方案

问题背景

问题本质分析

解决方案详解

网络Webhook控制器恢复

Windows系统代理计划修复

问题预防建议

技术原理深入

热门内容推荐

最新内容推荐

项目优选

Harvester项目升级失败问题分析：managed chart状态异常处理方案

问题背景

问题本质分析

解决方案详解

网络Webhook控制器恢复

Windows系统代理计划修复

问题预防建议

技术原理深入

相关内容推荐

热门内容推荐

最新内容推荐

项目优选