Amazon VPC CNI插件对EKS Pod Identity的支持演进与实践指南

2025-07-02 07:33:59作者：薛曦旖Francesca

背景概述

Amazon VPC CNI（Container Network Interface）作为AWS EKS集群中负责Pod网络通信的核心组件，其身份认证机制一直采用IRSA（IAM Roles for Service Accounts）方案。随着EKS Pod Identity这一更先进的认证方式的推出，社区对VPC CNI支持新特性的呼声日益高涨。

技术演进过程

初始支持阶段

在早期版本中，VPC CNI仅支持传统的IRSA认证方式。当用户尝试直接使用Pod Identity时，会遇到典型的"鸡生蛋蛋生鸡"问题：

Pod Identity Agent需要先运行才能为VPC CNI提供认证
但VPC CNI未正常运行会导致节点网络不可用
网络不可用又阻止了Pod Identity Agent的调度

关键突破点

社区通过实践发现了两个有效的解决方案：

方案一：容忍度配置增强 通过为Pod Identity Agent添加特定的容忍度配置，使其能够在节点未完全就绪时仍可被调度：

{
  "tolerations": [
    {
      "key": "node.kubernetes.io/not-ready",
      "operator": "Equal",
      "effect": "NoSchedule"
    }
  ]
}

方案二：回退到节点IAM角色 作为临时方案，可以将AmazonEKS_CNI_Policy直接附加到节点IAM角色，但这会降低安全隔离性。

官方解决方案

AWS团队在Pod Identity Agent v1.2.0-eksbuild.1版本中正式加入了必要的容忍度配置，从根本上解决了调度依赖问题。同时，VPC CNI从1.15.5版本开始已集成支持Pod Identity所需的SDK组件。

最佳实践建议

版本选择：确保使用VPC CNI 1.15.5+和Pod Identity Agent v1.2.0+版本组合
升级策略：建议分阶段升级，先保持IRSA配置升级CNI版本，再迁移到纯Pod Identity
故障排查：当遇到CNI Pod卡在就绪检查时，检查AWS_CONTAINER_CREDENTIALS_FULL_URI环境变量是否正常注入

技术原理深入

Pod Identity相比传统IRSA的主要优势在于：

消除了对OIDC提供商的依赖
简化了权限管理模型
提高了认证效率

在实现层面，VPC CNI通过检测环境变量AWS_CONTAINER_CREDENTIALS_FULL_URI自动切换至Pod Identity认证流程，这与标准AWS SDK的行为保持一致。

未来展望

随着Pod Identity的全面推广，预计AWS将进一步优化相关组件的默认配置，包括：

更智能的调度策略
更完善的文档支持
更紧密的版本兼容性管理

运维团队应持续关注官方更新，及时调整集群配置以获得最佳的安全性和可用性体验。

amazon-vpc-cni-k8s

Networking plugin repository for pod networking in Kubernetes using Elastic Network Interfaces on AWS

项目地址：https://gitcode.com/gh_mirrors/am/amazon-vpc-cni-k8s

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

nop-entropy

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

349

200

pytorch

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理