Actions Runner Controller 在 GitHub Enterprise 3.14.1 版本下的 Runner 注册问题分析与解决方案
问题背景
在使用 Actions Runner Controller (ARC) 项目部署自托管 Runner 时,用户遇到了与 GitHub Enterprise 3.14.1 版本的兼容性问题。主要症状表现为 Runner 无法成功注册,控制器日志中显示"RunnerScaleSetNotFoundException"错误,提示找不到标识符为12的Runner规模集。
问题分析
根本原因
经过深入分析,这个问题并非真正的版本兼容性问题,而是由于ARC资源清理不彻底导致的。具体表现为:
- 在重新安装ARC时,之前的安装残留了未完全清理的Custom Resources
- 这些残留资源保留了finalizers(终结器),阻止了Kubernetes的正常清理流程
- 新安装的ARC尝试使用相同的标识符注册Runner时,与残留资源产生冲突
技术细节
在Kubernetes中,finalizers是一种保护机制,确保资源在被删除前完成必要的清理工作。然而在某些情况下,特别是当控制器意外终止或删除操作被中断时,这些finalizers可能会被"卡住",导致资源无法被完全删除。
在ARC的场景中,以下资源类型特别容易出现这个问题:
- AutoscalingListeners
- EphemeralRunners
- RunnerScaleSets
解决方案
临时解决方案
对于已经出现问题的环境,可以手动清理残留资源:
-
首先检查所有相关的Custom Resources:
kubectl get AutoscalingListeners,EphemeralRunners,RunnerScaleSets -n <namespace> -
移除这些资源的finalizers:
kubectl get AutoscalingListeners -n <namespace> -o name | xargs -I {} kubectl patch {} -n <namespace> -p '{"metadata":{"finalizers":null}}' --type=merge -
对其他资源类型重复类似操作
最佳实践
为了避免此类问题,建议在升级或重新安装ARC时遵循以下步骤:
-
完全卸载现有安装:
helm uninstall <release-name> -
等待所有资源被完全清理(可能需要几分钟)
-
确认命名空间中没有残留资源:
kubectl get all,AutoscalingListeners,EphemeralRunners,RunnerScaleSets -n <namespace> -
确认可以删除命名空间(测试目的):
kubectl delete namespace <namespace> -
如果命名空间无法删除,说明仍有资源未清理,需要手动移除finalizers
-
确认清理完成后,再进行新版本的安装
预防措施
- 在升级ARC前,确保所有工作负载已完成
- 考虑在维护窗口期执行升级操作
- 监控卸载过程,确保所有资源被正确清理
- 对于生产环境,建议先在测试环境验证升级过程
总结
虽然这个问题表现为版本兼容性问题,但实际上是由于Kubernetes资源清理机制引起。理解Kubernetes的finalizer机制对于管理类似ARC这样的复杂Operator至关重要。通过遵循正确的卸载和安装流程,可以避免大多数此类问题。
对于未来版本,ARC团队已经意识到需要改进升级体验,可能会引入更健壮的清理机制和更明确的进度反馈,以帮助用户更好地管理生命周期操作。
- QQwen3-Next-80B-A3B-InstructQwen3-Next-80B-A3B-Instruct 是一款支持超长上下文(最高 256K tokens)、具备高效推理与卓越性能的指令微调大模型00
- QQwen3-Next-80B-A3B-ThinkingQwen3-Next-80B-A3B-Thinking 在复杂推理和强化学习任务中超越 30B–32B 同类模型,并在多项基准测试中优于 Gemini-2.5-Flash-Thinking00
GitCode-文心大模型-智源研究院AI应用开发大赛GitCode&文心大模型&智源研究院强强联合,发起的AI应用开发大赛;总奖池8W,单人最高可得价值3W奖励。快来参加吧~0230
PublicCMS266万多行代码修改 持续迭代9年 现代化java cms完整开源,轻松支撑千万数据、千万PV;支持静态化,服务器端包含,多级缓存,全文搜索复杂搜索,后台支持手机操作; 目前已经拥有全球0.0005%(w3techs提供的数据)的用户,语言支持中、繁、日、英;是一个已走向海外的成熟CMS产品Java00
AI内容魔方AI内容专区,汇集全球AI开源项目,集结模块、可组合的内容,致力于分享、交流。01- HHunyuan-MT-7B腾讯混元翻译模型主要支持33种语言间的互译,包括中国五种少数民族语言。00
GOT-OCR-2.0-hf阶跃星辰StepFun推出的GOT-OCR-2.0-hf是一款强大的多语言OCR开源模型,支持从普通文档到复杂场景的文字识别。它能精准处理表格、图表、数学公式、几何图形甚至乐谱等特殊内容,输出结果可通过第三方工具渲染成多种格式。模型支持1024×1024高分辨率输入,具备多页批量处理、动态分块识别和交互式区域选择等创新功能,用户可通过坐标或颜色指定识别区域。基于Apache 2.0协议开源,提供Hugging Face演示和完整代码,适用于学术研究到工业应用的广泛场景,为OCR领域带来突破性解决方案。00- HHowToCook程序员在家做饭方法指南。Programmer's guide about how to cook at home (Chinese only).Dockerfile06
- PpathwayPathway is an open framework for high-throughput and low-latency real-time data processing.Python00
- Dd2l-zh《动手学深度学习》:面向中文读者、能运行、可讨论。中英文版被70多个国家的500多所大学用于教学。Python011