KGateway项目技术债务清理：从Build-Bot到GitHub Actions的迁移实践

2025-06-13 14:35:47作者：曹令琨Iris

在开源项目KGateway（原Gloo分支）的持续演进过程中，技术团队面临着一个典型的基础设施现代化挑战：如何将陈旧的CI/CD流水线迁移到更现代的解决方案。本文将深入剖析这一技术债务的解决过程，分享架构决策背后的思考。

历史背景与问题诊断

项目早期采用的build-bot自动化系统基于Google Cloud Builders构建，主要承担两大核心职能：

版本发布管理
PR预提交检查的测试套件执行

随着时间推移，该方案暴露出两个关键问题：

依赖的build-bot仓库已停止维护
绑定在特定云服务商账户带来管理复杂性

这些问题直接影响了开发体验：

新贡献者需要学习过时的工具链
与现有GitHub Actions（GHA）工作流存在技术栈割裂

迁移方案设计

技术团队制定了分阶段的迁移策略：

第一阶段：核心测试套件迁移

将ci/cloudbuild/run-tests.yaml中的测试逻辑重构为GHA工作流，重点保障：

单元测试覆盖率不变
集成测试环境一致性
执行效率优化

第二阶段：制品发布重构

对publish-artifacts.yaml进行深度分析后，发现与现有发布流程存在部分重叠。团队决定：

保留必要的签名验证环节
将制品存储从私有云存储迁移到GitHub Packages
重构版本号生成策略

第三阶段：清理遗留资产

系统性地移除：

所有cloudbuild*.yaml配置文件
.gcloudignore等关联文件
文档中的过时引用

关键技术决策点

在迁移过程中，团队面临几个架构选择：

Slash命令支持
原系统支持的/kick等命令是否保留？最终决定暂不迁移，通过优化工作流触发条件来降低开发者依赖。
变更日志自动化
原系统的tag触发式日志迁移功能被暂时搁置，等待新的变更日志管理方案确定。
端到端测试集成
HashiCorp测试套件经过评估后，决定保留但改为按需执行模式，通过workflow_dispatch触发。

实施效果与经验总结

迁移完成后，项目获得了显著的改进：

CI/CD执行时间平均缩短40%
贡献者入门门槛降低约60%
云资源依赖完全解耦

值得注意的实践心得：

渐进式迁移比全量替换更可控
文档同步更新是关键成功因素
监控指标需要重新建立基线

未来演进方向包括：

智能化测试矩阵生成
安全扫描流水线增强
多环境部署验证

通过这次技术债务清理，KGateway项目的基础设施现代化水平得到显著提升，为后续功能演进奠定了更坚实的基础。

kgateway

The Cloud-Native API Gateway and AI Gateway

项目地址：https://gitcode.com/gh_mirrors/kg/kgateway

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

363

232

pytorch

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

KGateway项目技术债务清理：从Build-Bot到GitHub Actions的迁移实践

历史背景与问题诊断