Terraform AWS EKS模块中Bottlerocket节点DNS配置优化

2025-06-12 16:47:07作者：彭桢灵Jeremy

在AWS EKS集群中使用Bottlerocket操作系统时，DNS解析配置是一个需要特别注意的技术点。本文将深入探讨如何优化Bottlerocket节点的DNS配置，特别是当集群中部署了node-local-dns组件时的最佳实践。

Bottlerocket与DNS解析机制

Bottlerocket是AWS专为容器工作负载设计的轻量级操作系统，它在DNS解析方面有其独特的设计。默认情况下，Bottlerocket节点会配置集群DNS服务作为主要的DNS解析器。然而，当集群中部署了node-local-dns组件时，这种默认配置就需要进行调整。

node-local-dns的工作原理

node-local-dns是Kubernetes集群中常见的DNS缓存组件，它作为DaemonSet运行在每个节点上，监听169.254.20.10这个本地链路地址。它的主要作用是：

减少集群DNS服务的负载
提高DNS解析性能
增强DNS解析的可靠性

默认配置的局限性

在标准的Terraform AWS EKS模块中，Bottlerocket节点的DNS配置默认只包含集群DNS服务的IP地址（通常是10.0.0.10或172.21.0.10）。这种配置在以下场景下会出现问题：

当node-local-dns不可用时，Pod无法回退到集群DNS服务
当需要同时使用node-local-dns和集群DNS服务时

解决方案实现

为了解决上述问题，我们需要修改Terraform AWS EKS模块中的Bottlerocket用户数据模板，使其能够：

同时包含node-local-dns地址(169.254.20.10)和集群DNS服务地址
提供自定义DNS IP地址列表的能力

实现这一目标的关键在于修改用户数据模板中的cluster-dns-ip参数，使其接受一个IP地址列表而非单个IP地址。具体实现可以通过Terraform的local变量来动态生成合适的DNS IP地址列表。

配置示例

以下是一个改进后的Terraform配置示例，展示了如何动态生成包含node-local-dns和集群DNS服务的IP地址列表：

locals {
  # 自动生成包含node-local-dns和集群DNS的IP列表
  cluster_dns_ranges = length(var.custom_cluster_dns_ranges) > 0 ? var.custom_cluster_dns_ranges : [
    "169.254.20.10",   # node-local-dns地址
    var.cluster_service_cidr_range == "172.20.0.0/16" ? "172.21.0.10" : "10.0.0.10"  # 集群DNS服务地址
  ]
  
  # 将IP列表转换为Bottlerocket配置所需的格式
  cluster_dns_ips_string = "[${join(", ", formatlist("\"%s\"", local.cluster_dns_ranges))}]"
}