AWS Load Balancer Controller在无外网环境下的部署问题解析

2025-06-16 07:19:13作者：房伟宁

aws-load-balancer-controller

A Kubernetes controller for Elastic Load Balancers

项目地址：https://gitcode.com/gh_mirrors/aw/aws-load-balancer-controller

问题背景

在Kubernetes集群中使用AWS Load Balancer Controller时，经常会遇到Ingress资源无法正确创建Application Load Balancer的问题。特别是在企业内网环境中，当工作节点位于没有互联网访问权限的子网时，这个问题尤为常见。本文将以一个典型场景为例，深入分析问题原因并提供解决方案。

典型错误现象

当尝试在EKS集群中创建Ingress资源时，虽然所有资源配置看似正确，但ALB并未如期创建。通过查看控制器日志，会发现如下关键错误信息：

NoCredentialProviders: no valid providers in chain

同时，使用kubectl describe命令查看Ingress资源时，事件中会显示"Failed build model"的警告信息。

根本原因分析

这个问题通常与EC2实例元数据服务(IMDS)的配置有关。在AWS环境中，工作节点需要通过IMDS获取临时安全凭证来访问AWS API。当出现以下情况时会导致凭证获取失败：

元数据服务访问限制：默认情况下，IMDS的HTTP PUT响应跳数限制为1，这意味着只有直接访问实例的请求才能获取元数据。在Kubernetes环境下，Pod需要通过节点代理访问IMDS，这需要至少2跳。
网络隔离环境：在严格的内网环境中，如果节点没有配置正确的IMDS访问权限，即使跳数设置正确，也无法获取凭证。
安全令牌要求：现代AWS环境通常要求使用IMDSv2，需要提供安全令牌才能访问元数据服务。

解决方案

要解决这个问题，需要对EC2工作节点的IMDS配置进行调整：

aws ec2 modify-instance-metadata-options \
    --http-put-response-hop-limit 2 \
    --http-tokens required \
    --region <region> \
    --instance-id <instance-id>

这个命令做了三件重要的事情：

将HTTP PUT响应跳数限制设置为2，允许通过代理访问元数据服务
强制要求使用IMDSv2安全令牌
确保配置立即生效

深入技术细节

IMDS跳数限制的工作原理

在Kubernetes环境中，Pod通过节点的kubelet代理访问IMDS。请求的路径是： Pod → Kubelet → IMDS

这需要至少2跳才能完成。如果跳数限制为1，请求会在kubelet处被拦截，导致凭证获取失败。

IMDSv2的安全优势

IMDSv2引入了会话令牌机制，每个请求都需要先获取临时令牌，然后用令牌访问实际元数据。这大大提高了安全性，防止了常见的SSRF攻击。

企业网络环境考量

在严格的内网环境中，还需要确保：

安全组规则允许节点访问IMDS(169.254.169.254)
网络ACL没有阻断相关流量
节点有正确的IAM角色附加

最佳实践建议

统一配置管理：在Terraform或CloudFormation模板中预设IMDS配置，避免手动操作
安全加固：始终使用IMDSv2并设置适当的跳数限制
环境验证：部署前验证节点能否正常获取元数据
监控告警：设置监控以捕获凭证获取失败事件

总结

aws-load-balancer-controller

A Kubernetes controller for Elastic Load Balancers

项目地址：https://gitcode.com/gh_mirrors/aw/aws-load-balancer-controller

登录后查看全文

热门内容推荐

1 【亲测免费】开源项目 `build-your-own-x` 使用指南 2 【亲测免费】探索科技之旅：《Build Your Own X》项目详解 3 GitHub_Trending/bu/build-your-own-x自动化：CI/CD流程在自制项目中的应用 4 从零打造智能家居系统：用build-your-own-x实现家庭自动化

最新内容推荐

Degrees of Lewdity中文汉化终极指南：零基础玩家必看的完整教程 Unity游戏翻译神器：XUnity Auto Translator 完整使用指南 PythonWin7终极指南：在Windows 7上轻松安装Python 3.9+终极macOS键盘定制指南：用Karabiner-Elements提升10倍效率 Pandas数据分析实战指南：从零基础到数据处理高手 Qwen3-235B-FP8震撼升级：256K上下文+22B激活参数 7步搞定机械键盘PCB设计：从零开始打造你的专属键盘终极WeMod专业版解锁指南：3步免费获取完整高级功能 DeepSeek-R1-Distill-Qwen-32B技术揭秘：小模型如何实现大模型性能突破音频修复终极指南：让每一段受损声音重获新生

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

flutter_flutter

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理