GitHub Actions Runner 中BrokerMigration消息循环问题分析与解决

2025-06-08 14:00:28作者：宗隆裙

问题现象

在使用GitHub Actions Runner时，部分用户遇到了Runner持续打印"BrokerMigration message received. Polling Broker for messages..."日志的问题。这些Runner在UI界面上显示为"空闲"状态，但实际上无法接收和执行任何作业任务。该问题会导致CI/CD流程中断，影响生产环境。

问题分析

典型症状

Runner日志中持续输出BrokerMigration相关消息，间隔约50秒一次
Runner状态显示为"空闲"，但实际无法处理作业
问题可能持续数小时不自动恢复
部分情况下伴随HTTP 404错误

根本原因

经过分析，该问题主要由以下几个因素导致：

标签配置错误：工作流中runs-on字段指定的Runner标签存在前导或后置空格，如" gha-runner-scale-set"。
Runner组权限问题：Runner所属的Runner组未正确配置访问权限，无法访问目标仓库。
Runner版本兼容性：特定版本的Runner(如2.320.0)可能存在Broker通信问题。
Scale Set Runner标签误用：Scale Set Runner被错误地添加了自定义标签。

解决方案

1. 检查工作流配置

确保工作流中的runs-on字段正确指定Runner标签，特别注意：

移除标签字符串中的任何前导或后置空格
对于Scale Set Runner，使用正确的标签格式

2. 验证Runner组权限

进入GitHub组织或企业设置
导航到Runner组配置
确认目标仓库已被正确添加到Runner组的访问列表中

3. 处理卡住的Runner

对于已经处于问题状态的Runner，可以采取以下措施：

通过GitHub UI手动删除问题Runner
等待系统自动创建新的Runner实例
或者直接重启Runner服务

4. Scale Set Runner最佳实践

避免添加自定义标签：Scale Set Runner设计上不应添加额外标签
保持版本更新：使用较新版本的Runner可减少兼容性问题
合理配置min/max Runner数量：根据实际负载需求调整

预防措施

配置检查工具：开发预提交钩子或CI检查，验证工作流中的Runner标签格式
监控告警：设置对Runner长时间空闲状态的监控
版本管理：建立Runner版本升级机制，及时应用修复版本
文档规范：团队内部明确Runner使用规范，特别是标签命名规则

技术背景

GitHub Actions Runner通过Broker服务与GitHub后端通信。当Runner启动时，会建立会话并定期轮询消息。"BrokerMigration"消息表明Runner正在尝试与消息代理建立连接。正常情况下，这个过程应该很快完成并开始接收作业。当出现配置错误或通信问题时，会导致这个状态持续循环。

通过遵循上述解决方案和最佳实践，可以有效预防和解决这类Runner通信问题，确保CI/CD管道的稳定运行。

runner

The Runner for GitHub Actions :rocket:

项目地址：https://gitcode.com/gh_mirrors/ru/runner

登录后查看全文