Flutter项目中的Cocoon回归测试问题分析与解决方案

2025-04-26 03:26:55作者：房伟宁

在Flutter项目的持续集成流程中，最近发现了一个与Cocoon测试调度系统相关的回归问题。这个问题影响了稳定分支的代码合并流程，导致即使代码变更已经获得批准，也无法顺利合并到稳定版本中。

问题背景

在Flutter项目的开发过程中，团队会定期将重要的修复从主分支(cherry-pick)合并到稳定分支。然而，近期发现当尝试将已批准的变更合并到3.29稳定候选版本时，出现了13个测试任务失败的情况。这些失败并非由于代码本身的问题，而是因为测试配置发生了变化。

具体表现为Cocoon系统尝试调度一些已经不存在的测试构建器(builder)，如"Linux web_tests_4"、"Linux_android_emu_34 android views"和"Mac mac_clang_tidy"等。这些构建器在主分支上已被移除，但在稳定分支的测试流程中仍被引用。

技术分析

深入分析这个问题，我们发现其根源在于Flutter的CI/CD架构设计：

构建器配置生成机制：目前构建器配置仅基于主分支(master)生成，这意味着当主分支移除某些构建器后，稳定分支仍会尝试使用这些已不存在的构建器。
Cocoon调度行为：Cocoon系统严格遵循测试配置，当发现配置中指定的构建器不存在时，会直接导致任务失败，而不是智能地跳过或标记为通过。
分支差异处理：主分支和稳定分支之间的配置差异是正常现象，特别是在长期维护的稳定分支上。当前的系统没有很好地处理这种配置差异。

解决方案探讨

针对这个问题，团队讨论了多种可能的解决方案：

限制稳定分支的代码合并：当主分支和稳定分支差异过大时，停止向稳定分支合并代码。这种方法虽然简单，但会影响修复的及时交付。
临时恢复已移除的构建器：在主分支上临时恢复已移除的构建器，并标记为bringup状态。这种方法可以解决问题，但会延长构建器的生命周期，增加维护成本。
改进Cocoon调度逻辑：修改Cocoon系统，使其能够智能处理缺失的构建器，特别是在稳定分支上。可以设计为跳过缺失的构建器或将其标记为通过，同时提供警告信息。
改进配置同步策略：扩展构建器配置生成机制，使其不仅为主分支生成配置，也为活跃的稳定分支生成配置。这种方法可以从根本上解决问题，但实现复杂度较高。