cert-manager控制器Pod启动失败问题分析与解决

2025-05-18 12:41:13作者：彭桢灵Jeremy

cert-manager作为Kubernetes集群中管理TLS证书的重要组件，其稳定运行对集群安全至关重要。近期有用户反馈在部署cert-manager 1.15.0版本时，控制器Pod无法正常启动，报错显示"unknown flag: --cluster-resource-namespace"。

问题现象

当用户通过Helm chart部署cert-manager时，控制器Pod进入Error状态，日志中显示以下关键错误信息：

E0613 06:30:43.706504       1 main.go:41] "error executing command" err="unknown flag: --cluster-resource-namespace" logger="cert-manager"

根本原因分析

经过深入排查，发现该问题通常由以下两种情况导致：

镜像版本不匹配：用户可能错误地指定了不同组件的镜像（如使用了cainjector的镜像来运行控制器），导致启动参数不兼容。
镜像源配置错误：在企业环境中，当需要从内部镜像仓库拉取镜像时，如果values.yaml文件中镜像路径配置不正确，可能导致拉取了错误的镜像版本。

解决方案

针对这一问题，建议采取以下解决步骤：

检查values.yaml配置：确保controller.image.repository和controller.image.tag指向正确的控制器镜像地址和版本。
验证镜像一致性：确认部署的所有cert-manager组件（controller、webhook、cainjector）都使用匹配的版本。
完整部署示例：正确的Helm安装命令应类似如下格式：

helm install cert-manager jetstack/cert-manager \
  --namespace cert-manager \
  --create-namespace \
  --set installCRDs=true \
  --set image.repository=<内部仓库地址>/cert-manager-controller \
  --set image.tag=v1.15.0