Kargo项目版本升级导致Promotion状态异常的故障分析

2025-07-02 05:29:33作者：邓越浪Henry

问题背景

在Kargo项目从1.5.1版本升级到1.5.2版本后，用户报告了一个严重问题：所有Stage Promotions都处于Pending状态无法推进。这个问题在回滚到1.5.1版本后消失，但再次升级到1.5.2版本时又复现。

从日志中可以观察到两个关键错误信息：

status.freightHistory[0].verificationHistory[0].id: Required value

经过开发团队调查，发现这个问题源于CRD(自定义资源定义)版本与控制器版本的不匹配。具体来说：

开发团队迅速响应，在1.5.3版本中修复了这个问题。用户升级到1.5.3版本后，Promotion功能恢复正常。

Promotion流程卡住的具体技术原因是：控制器尝试更新Stage状态时，新添加的CRD验证规则要求verificationHistory必须包含id字段。由于旧版本控制器没有设置这个字段，更新请求被API服务器拒绝，导致Promotion无法推进。

对于使用Kargo或其他类似工具的用户，建议：

这次事件展示了开源社区快速响应和解决问题的能力，也提醒我们在进行系统升级时需要更加谨慎。

登录后查看全文