使用FluxCD部署GitHub Actions Runner Scale Set Controller的常见问题与解决方案

2025-06-08 11:37:33作者：咎竹峻Karen

GitHub Actions Runner Controller项目中的gha-runner-scale-set-controller组件是一个用于管理自托管运行器的关键组件。许多团队选择使用FluxCD作为GitOps工具来部署这一组件，但在实际部署过程中可能会遇到一些技术挑战。

在FluxCD部署过程中，一个典型的问题是由于Helm chart版本号格式导致的部署失败。具体表现为当使用OCIRepository方式拉取0.9.3版本的chart时，系统会报错提示Deployment的标签值"0.9.3+4fda46fd8c4e"无效，因为其中包含的加号(+)不符合Kubernetes标签的命名规范。

这个问题的根本原因在于FluxCD在构建OCI仓库引用时，会自动将chart的版本号与git提交哈希拼接起来作为完整版本标识，而这个拼接后的字符串被直接用作Deployment资源的标签值。Kubernetes对标签值有严格限制，只允许包含字母数字、连字符、下划线和点号，且必须以字母数字开头和结尾。

针对这个问题，社区中已经形成了两种有效的解决方案：

第一种方案是改用GitRepository方式直接从GitHub仓库拉取chart。这种方法通过指定特定的tag格式(如gha-runner-scale-set-0.9.3)来获取chart，避免了OCI仓库版本拼接带来的问题。同时配合ignore字段可以精确控制只拉取charts目录下的内容，减少不必要的网络传输。

第二种方案是继续使用HelmRepository方式，但需要确保集群网络能够正常访问GitHub容器注册表(ghcr.io)。这种方法需要正确配置sourceRef，并确保集群的出站网络策略允许访问相关域名和端口。

从技术实现角度来看，这两种方案各有优劣。GitRepository方式更加稳定可靠，但可能需要处理更多的仓库内容；OCI方式更加轻量，但对网络环境要求更高。团队可以根据自身的网络环境和运维偏好选择合适的部署方式。

随着GitOps实践的普及，这类基础设施组件的部署问题会越来越常见。理解这些问题的根源和解决方案，有助于团队构建更加稳定可靠的CI/CD流水线。建议在采用任何方案前，先在测试环境中验证，并考虑设置适当的重试机制以提高部署的可靠性。

actions-runner-controller

Kubernetes controller for GitHub Actions self-hosted runners

项目地址：https://gitcode.com/GitHub_Trending/ac/actions-runner-controller

登录后查看全文