Knative Serving 1.17.0版本安装失败问题分析与解决方案

2025-06-06 10:17:27作者：袁立春Spencer

问题背景

在使用Knative Operator通过Helm安装Knative Serving 1.17.0版本时，用户遇到了安装失败的问题。具体表现为storage-version-migration-serving-serving-1.17.0这个Job无法完成，导致整个Knative Serving组件无法就绪。

根本原因分析

这个问题本质上是一个Kubernetes Job的不可变性问题。当Operator尝试创建或更新storage-version-migration-serving-serving-1.17.0这个Job时，Kubernetes API Server拒绝了请求，原因是Job的pod模板字段被标记为不可变(immutable)。

这种问题通常发生在以下场景：

尝试更新一个已经存在的Job的pod模板
在升级过程中，Operator尝试重新创建已经存在的Job
集群中可能存在残留的旧版本Job资源

技术细节

storage-version-migration是Knative用来处理API版本迁移的一个重要组件。它在安装或升级过程中运行，负责将CRD(自定义资源定义)的存储版本从旧版本迁移到新版本。这个Job的失败会导致Knative Serving无法正确完成安装。

从错误信息可以看出，问题出在Job的spec.template字段上。Kubernetes的设计中，Job的pod模板一旦创建就不能修改，这是为了保证Job执行的一致性。

解决方案

目前有以下几种可行的解决方案：

手动清理残留Job：首先删除失败的Job：

kubectl delete job storage-version-migration-serving-serving-1.17.0 -n knative-serving

然后让Operator重新创建它。

修改Operator配置：在KnativeServing CRD中排除这个post-install Job：

apiVersion: operator.knative.dev/v1beta1
kind: KnativeServing
metadata:
  name: knative-serving
  namespace: knative-serving
spec:
  manifests:
    - URL: https://github.com/knative/serving/releases/download/v1.17.0/serving-core.yaml
    - URL: https://github.com/knative/serving/releases/download/v1.17.0/serving-post-install-jobs.yaml
      exclude:
        - storage-version-migration-serving-serving-1.17.0