Karpenter Provider AWS 1.0+版本CRD升级问题解析

2025-05-31 04:17:01作者：卓艾滢Kingsley

在Kubernetes集群中使用Karpenter Provider AWS时，从1.0版本开始，CRD（Custom Resource Definition）的升级方式发生了重要变化。本文将深入分析这一变化带来的影响以及正确的升级方法。

问题背景

许多用户在升级到Karpenter 1.0+版本时遇到了CRD升级失败的问题。具体表现为：

使用Helm Chart升级后，CRD仍保持旧版本的schema
尝试创建或更新NodePool资源时，新的字段（如spec.disruption.consolidationPolicy）不被识别
使用Flux CD等GitOps工具时，CRD升级流程不按预期工作

根本原因

Karpenter 1.0版本对CRD管理策略做了重大调整：

1.0+版本中，CRD升级不再通过主Chart自动完成
需要显式使用专门的karpenter-crd Chart来管理CRD
资源API版本从v1beta1升级到了v1

解决方案

1. 分离CRD管理

正确的做法是将CRD管理与主应用部署分离：

apiVersion: helm.toolkit.fluxcd.io/v2
kind: HelmRelease
metadata:
  name: karpenter-crd
  namespace: kube-system
spec:
  chart:
    spec:
      chart: karpenter-crd
      version: "1.0.8"
      sourceRef:
        kind: HelmRepository
        name: karpenter

2. 主应用部署配置

主应用部署时应跳过CRD管理：

apiVersion: helm.toolkit.fluxcd.io/v2
kind: HelmRelease
metadata:
  name: karpenter
  namespace: kube-system
spec:
  install:
    crds: Skip
  upgrade:
    crds: Skip
  chart:
    spec:
      chart: karpenter
      version: 1.0.8

3. 资源定义更新

所有自定义资源(如EC2NodeClass、NodePool等)必须更新API版本：

apiVersion: karpenter.k8s.aws/v1  # 注意从v1beta1改为v1
kind: EC2NodeClass
metadata:
  name: bottlerocket
spec:
  kubelet:  # 新版本支持的新字段
    evictionHard:
      memory.available: 0.5Gi