RKE2项目中CoreDNS版本升级问题解析与解决方案

2025-07-09 13:42:53作者：幸俭卉

项目地址：https://gitcode.com/gh_mirrors/rk/rke2

背景介绍

在Kubernetes生态系统中，CoreDNS作为默认的DNS服务组件，承担着集群内部服务发现的重要职责。近期在RKE2项目（Rancher Kubernetes Engine 2）中，用户报告了一个与CoreDNS版本相关的服务发现问题，特别是在使用publishNotReadyAddresses特性时出现了异常行为。

问题现象

在RKE2 v1.29.15+rke2r1版本中，默认集成了CoreDNS v1.12.0版本。用户发现当部署服务时设置了publishNotReadyAddresses=true参数，并且关联的Pod处于故障状态时，该Pod的IP地址没有如预期那样出现在DNS记录中。这一行为与Kubernetes的服务发现机制预期不符，因为publishNotReadyAddresses参数的设计初衷正是为了在Pod未就绪时仍然发布其地址信息。

技术分析

经过深入调查，发现这是CoreDNS v1.12.0版本引入的一个破坏性变更导致的。CoreDNS团队已经确认了这个问题，并在后续的v1.12.1版本中进行了修复，恢复了原有的行为逻辑。

在Kubernetes环境中，publishNotReadyAddresses是一个重要的服务属性，它允许服务在关联Pod未通过就绪检查时仍然发布其地址。这一特性在某些场景下非常有用，例如：

需要保持长连接的应用程序
需要逐步启动的服务
某些需要主动健康检查而非被动发现的特殊场景

CoreDNS v1.12.0版本的变更意外破坏了这一功能，影响了依赖此特性的应用正常运行。

解决方案

RKE2团队已经确认将在下一个发布周期（4月版本）中更新CoreDNS至v1.12.1版本。对于急需解决问题的用户，可以通过以下临时方案进行手动修复：

创建HelmChartConfig资源来覆盖默认的CoreDNS镜像标签
将CoreDNS版本显式设置为v1.12.1-build20250401

具体操作可通过以下YAML配置实现：

apiVersion: helm.cattle.io/v1
kind: HelmChartConfig
metadata:
  name: rke2-coredns
  namespace: kube-system
spec:
  valuesContent: |-
    image:
      tag: "v1.12.1-build20250401"