Flox项目中Tailscale下载导致的CI不稳定问题分析

2025-06-26 11:11:21作者：胡唯隽

在Flox项目的持续集成(CI)流程中，开发团队遇到了一个由Tailscale下载引起的不稳定问题。这个问题表现为在CI环境中下载Tailscale软件包时频繁出现HTTP/2流未正确关闭的错误，导致构建过程失败，每次失败都会浪费团队20分钟以上的宝贵时间。

问题现象

在Flox的CI构建过程中，系统需要从Tailscale官方服务器下载特定版本的软件包。观察到的典型错误表现为：

curl: (92) HTTP/2 stream 1 was not closed cleanly: INTERNAL_ERROR (err 2)

这种错误发生时，下载速度异常缓慢（约150k/s），且不特定于某个下载进度百分比或已用时间。值得注意的是，该问题在合并队列中尤为突出，严重影响了开发效率。

技术背景

Tailscale是一种基于现代网络协议的解决方案，Flox项目在CI环境中使用它来建立安全的网络连接。通常，CI系统会通过GitHub Action从Tailscale官方服务器下载预编译的二进制包进行安装。

HTTP/2是HTTP协议的第二个主要版本，相比HTTP/1.1提供了多路复用、头部压缩等改进特性。但在某些网络环境下，特别是通过代理或特殊网络配置时，HTTP/2的实现可能会出现兼容性问题。

问题分析

经过团队调查，发现以下几个关键点：

该问题与特定Tailscale版本无关，尝试更新版本并未解决问题
使用的GitHub Action是最新版本，下载步骤没有待处理的变更
错误发生时网络吞吐量显著下降
上游Tailscale的GitHub Action仓库中已有关于缓存机制的讨论，但尚未实现

这些问题表明，根本原因可能在于：

Tailscale服务器与GitHub CI环境之间的网络连接不稳定
HTTP/2协议在特定网络路径上的实现存在兼容性问题
缺乏有效的缓存机制导致每次都需要重新下载大文件

解决方案

针对这一问题，Flox团队采取了以下措施：

绕过GitHub Action直接使用系统包：改为直接从Flox或nixpkgs获取Tailscale，减少对外部下载的依赖
实现本地缓存：虽然上游尚未支持，但在本地构建缓存机制可以减少对外部网络的依赖
网络连接优化：检查CI环境的网络配置，确保HTTP/2连接能够稳定建立

这种解决方案的优势在于：

消除了对外部下载的依赖，提高构建可靠性
减少了网络传输时间，提高构建速度
降低了因网络问题导致构建失败的概率

经验总结

这个案例为分布式系统开发提供了几个重要启示：

外部依赖管理：即使是知名服务的依赖也可能成为系统稳定性的瓶颈
CI/CD优化：构建过程中应尽量减少对外部网络的依赖，特别是大文件下载
协议选择：在某些受限环境中，HTTP/1.1可能比HTTP/2更稳定
缓存策略：对于频繁使用的大文件，本地缓存可以显著提高可靠性

通过解决这个问题，Flox团队不仅提高了CI管道的稳定性，也为类似场景下的网络依赖管理积累了宝贵经验。这种从实际问题出发，逐步优化系统架构的做法，正是现代DevOps实践的典范。

flox

Developer environments you can take with you

项目地址：https://gitcode.com/gh_mirrors/fl/flox

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

nop-entropy

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

349

200

pytorch

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理

Flox项目中Tailscale下载导致的CI不稳定问题分析

问题现象

技术背景

问题分析

解决方案

经验总结

热门内容推荐

最新内容推荐

项目优选

Flox项目中Tailscale下载导致的CI不稳定问题分析

问题现象

技术背景

问题分析

解决方案

经验总结

相关内容推荐

热门内容推荐

最新内容推荐

项目优选