Terraform AWS EKS模块中节点安全组规则添加问题解析

2025-06-12 00:26:18作者：毕习沙Eudora

项目地址：https://gitcode.com/GitHub_Trending/te/terraform-aws-eks

问题背景

在使用terraform-aws-eks模块管理AWS EKS集群时，开发人员经常需要为节点安全组添加额外的网络规则。一个常见场景是通过node_security_group_additional_rules参数自定义入站和出站规则。然而，在实际操作中，当尝试添加多个规则时，系统可能会报错"couldn't find resource"，导致规则无法正确应用。

问题现象

开发人员反馈，当在node_security_group_additional_rules中配置多个规则时，Terraform会在执行约5分钟后超时，并抛出以下错误：

Error: waiting for Security Group (sg-0d2cce84d63789414) Rule (sgrule-2254432922) create: couldn't find resource

有趣的是，当省略规则中的description字段时，问题不会出现。此外，通过AWS控制台手动添加相同的规则却能成功，这表明规则本身是有效的。

根本原因分析

经过深入排查，发现问题根源在于规则定义中缺少了self字段的正确配置。在AWS安全组规则中，self是一个关键参数，它决定了规则是否应用于安全组自身。当这个字段未被明确定义时，会导致Terraform与AWS API之间的交互出现异常。

值得注意的是，AWS安全组规则有两种实现方式：

传统的aws_security_group_rule资源
较新的aws_vpc_security_group_egress_rule和aws_vpc_security_group_ingress_rule资源

传统实现方式在包含description字段时可能存在一些已知的限制，这解释了为什么省略description可以暂时解决问题。

解决方案

要正确配置节点安全组的额外规则，必须确保每个规则定义中包含完整的必要参数。以下是一个正确的配置示例：

node_security_group_additional_rules = {
  node_rules_1 = {
    description = "My first node rule"
    protocol    = "tcp"
    type        = "ingress"
    self        = true  # 必须明确设置
    from_port   = 9666
    to_port     = 9666
  }
  node_rules_2 = {
    description = "My second node rule"
    protocol    = "udp"
    type        = "ingress"
    self        = true  # 必须明确设置
    from_port   = 27050
    to_port     = 27249
  }
}