Flux2 项目中 Helm 升级失败问题深度解析：模板变量在 YAML 字段名中的陷阱

2025-05-30 22:40:13作者：幸俭卉

在 Kubernetes 生态系统中，Flux2 作为一款优秀的 GitOps 工具，与 Helm 深度集成以实现应用部署的自动化。近期出现了一个值得注意的技术问题：当 Helm Chart 的 YAML 字段名中包含模板变量时，会导致 Flux2 的 HelmRelease 升级操作失败，而初次安装却能成功。

问题现象

该问题最初在使用 Bitnami 的 Kafka Helm Chart (32.0.1 版本)时被发现。具体表现为：

初次通过 Flux2 部署 HelmRelease 时一切正常
当尝试修改 HelmRelease 的 values 配置并触发升级时，操作失败
错误信息显示系统无法在 Secret 中找到名为 "controller-{{ $i }}-id" 的键

根本原因分析

深入研究发现，问题根源在于 Helm Chart 模板中的一段特殊代码：

{{- range $i := until (int .Values.controller.replicaCount) }}
controller-{{ $i }}-id: {{ include "common.secrets.passwords.manage" (dict "secret" (printf "%s-kraft" (include "common.names.fullname" $)) "key" "controller-{{ $i }}-id" "providedValues" (list "") "length" 22 "context" $) }}
{{- end }}

这段代码存在两个关键问题：

在 YAML 字段名中使用了模板变量 controller-{{ $i }}-id
在密码管理函数调用中，键名参数也使用了相同的模板语法

这种写法违反了 Helm 模板渲染的基本原则。在 Helm 的模板处理流程中，YAML 字段名中的模板变量会在不同阶段被处理，导致升级时出现不一致的行为。

技术背景

Helm 的模板渲染分为多个阶段：

解析阶段：处理 Chart 结构和基础模板
值合并阶段：合并默认值和用户提供的值
模板渲染阶段：执行所有模板逻辑
验证阶段：检查生成的 Kubernetes 清单

当模板变量出现在 YAML 字段名中时，这种非常规用法会导致 Helm 在不同阶段对同一模板产生不同的解释，特别是在升级操作时，由于需要处理现有资源和状态，这种不一致性会被放大。

解决方案

Bitnami 团队已经修复了这个问题，正确的做法应该是：

{{- range $i := until (int .Values.controller.replicaCount) }}
controller-{{ $i }}-id: {{ include "common.secrets.passwords.manage" (dict "secret" (printf "%s-kraft" (include "common.names.fullname" $)) "key" (printf "controller-%d-id" $i) "providedValues" (list "") "length" 22 "context" $) }}
{{- end }}