Harvester项目中DNS运行时变更未触发CoreDNS Pod重启的问题分析

2025-06-15 19:00:56作者：翟江哲Frasier

在Harvester v1.4.0版本中，当管理员通过netconfig工具更新DNS服务器配置时，系统存在一个值得注意的行为特性：虽然网络配置变更能够成功应用，但RKE2-CoreDNS相关的Pod不会自动重启，导致新的DNS设置无法立即生效。

问题现象

当管理员按照Harvester文档执行运行时配置变更，特别是修改NETCONFIG_DNS_STATIC_SERVERS参数时，配置变更虽然被系统接受，但集群内的DNS解析服务仍保持使用旧的DNS服务器设置。只有在手动重启rke2-coredns-rke2-coredns部署后，新的DNS配置才会真正生效。

技术背景

Harvester基于RKE2构建其Kubernetes集群，而RKE2使用CoreDNS作为集群的DNS解析服务。CoreDNS的配置通常由RKE2管理，其Pod会从节点获取DNS解析设置。当节点网络配置变更时，理想情况下相关服务应能自动感知并重新加载配置。

问题原因分析

配置更新机制不完整：netconfig工具虽然能够更新节点的网络配置，但缺乏对相关Kubernetes工作负载的联动处理逻辑。
CoreDNS配置加载特性：CoreDNS在启动时会读取节点上的resolv.conf文件，但运行时不会自动重新加载该文件的变化。
生命周期管理缺失：Harvester当前实现中没有包含对CoreDNS工作负载的自动滚动更新机制，导致配置变更后服务仍保持原有状态。

解决方案建议

对于生产环境，建议采用以下两种方式之一：

手动处理方案：
- 执行netconfig update应用DNS变更
- 手动删除rke2-coredns-rke2-coredns部署的Pod，触发Kubernetes重建
- 验证新Pod是否加载了正确的DNS配置
自动化改进方案（需产品增强）：
- 增强netconfig工具，在检测到DNS配置变更时自动触发CoreDNS部署的滚动更新
- 或实现CoreDNS配置的热重载机制，避免需要重启Pod