AWS Load Balancer Controller中NLB子网配置的常见误区解析

2025-06-16 22:42:58作者：范垣楠Rhoda

背景概述

在使用Kubernetes的AWS Load Balancer Controller时，许多开发者会遇到网络负载均衡器(NLB)未按预期部署到指定子网的情况。本文将以一个典型场景为例，深入分析问题根源并提供解决方案。

问题现象

开发者在Service配置中明确指定了子网注解：

service.beta.kubernetes.io/aws-load-balancer-subnets: subnet-xxx,subnet-yyy

但实际创建的NLB却部署在了其他三个无关子网上，且没有任何错误日志提示。

核心问题分析

经过深入排查，发现问题的本质在于控制器选择机制：

双控制器共存问题：在Kubernetes 1.20环境中，AWS云提供商的内置(in-tree)负载均衡控制器与独立的AWS Load Balancer Controller可能同时存在
注解识别差异：内置控制器不会识别aws-load-balancer-type: nlb等专属于AWS Load Balancer Controller的注解
默认行为冲突：当内置控制器处理Service时，会忽略子网注解而使用默认子网选择逻辑

解决方案

要确保NLB部署到正确子网，需要强制指定使用AWS Load Balancer Controller：

添加专属注解声明：

service.beta.kubernetes.io/aws-load-balancer-type: "external"

完整注解示例：

metadata:
  annotations:
    service.beta.kubernetes.io/aws-load-balancer-type: "external"
    service.beta.kubernetes.io/aws-load-balancer-subnets: "subnet-xxx,subnet-yyy"
    service.beta.kubernetes.io/aws-load-balancer-scheme: "internal" # 可选

实现原理深度解析

控制器选择机制：
- external注解会显式告知Kubernetes使用AWS Load Balancer Controller
- 未指定时，系统可能回退到内置控制器
子网选择优先级：
- 显式子网注解 > 自动发现子网
- 子网必须满足NLB部署要求（适当的标签和网络配置）
验证手段：
- 检查Service事件的控制器来源
- 确认AWS资源标签包含elbv2.k8s.aws/cluster标识