解决google-github-actions/setup-gcloud在自托管Runner中的存储限制问题

2025-07-08 13:03:44作者：姚月梅Lane

问题背景

在使用google-github-actions/setup-gcloud项目时，许多开发者在自托管的GitHub Actions Runner上遇到了一个棘手的问题：当执行setup-gcloud步骤时，Runner会突然终止并显示"收到关机信号"的错误信息。这个问题特别容易出现在Kubernetes环境中部署的自托管Runner上。

问题现象

典型的错误表现包括：

工作流在执行setup-gcloud步骤时突然终止
日志中显示"The runner has received a shutdown signal"错误
整个过程没有明显的错误提示，只是Runner被意外终止
执行时间大约在35秒左右后失败

根本原因分析

经过深入调查，这个问题通常是由于Kubernetes Pod的资源限制导致的，具体表现为：

临时存储空间不足：默认情况下，Kubernetes Pod的临时本地存储限制为1GiB，而setup-gcloud在安装过程中需要解压较大的Google Cloud SDK包，很容易超过这个限制。
资源限制触发Pod驱逐：当Pod的存储使用超过限制时，Kubernetes会主动驱逐(Evict)该Pod，导致Runner进程被强制终止。
错误信息不明确：由于是底层资源限制导致的终止，表面上的错误信息并不能直接反映出真实原因，增加了排查难度。

解决方案

针对这个问题，有以下几种解决方案：

方案一：增加Pod资源限制

在部署Runner的Kubernetes配置中，增加临时存储的限制：

resources:
  limits:
    ephemeral-storage: "5Gi"
  requests:
    ephemeral-storage: "2Gi"

方案二：调整Runner配置

如果使用GitHub Actions Runner Controller，可以在values.yaml中配置：

resources:
  limits:
    cpu: "4"
    memory: "8Gi"
    ephemeral-storage: "5Gi"
  requests:
    cpu: "2"
    memory: "4Gi"
    ephemeral-storage: "2Gi"

方案三：使用更轻量的安装选项

在setup-gcloud步骤中，可以尝试使用更小的安装包：

- uses: google-github-actions/setup-gcloud@v2
  with:
    install_components: "gcloud"

最佳实践建议

监控资源使用：在部署自托管Runner时，建议监控Pod的资源使用情况，特别是存储空间。
预留缓冲空间：不要将资源限制设置得刚好满足当前需求，应该预留20-30%的缓冲空间。
定期维护：定期清理Runner上的临时文件，避免存储空间被长期占用。
测试环境验证：在生产环境部署前，先在测试环境中验证资源限制是否足够。

总结

在Kubernetes环境中使用自托管GitHub Actions Runner运行google-github-actions/setup-gcloud时，存储限制是一个常见但容易被忽视的问题。通过合理配置资源限制和监控资源使用情况，可以有效避免这类问题的发生。对于运维团队来说，理解底层资源限制对CI/CD流程的影响至关重要，这有助于快速定位和解决类似问题。

setup-gcloud

A GitHub Action for installing and configuring the gcloud CLI.

项目地址：https://gitcode.com/gh_mirrors/se/setup-gcloud

登录后查看全文