Let's Encrypt项目中ARM架构下cryptography编译问题的分析与解决

2025-05-04 01:58:23作者：伍希望

在Let's Encrypt项目的Docker镜像构建过程中，开发团队遇到了一个棘手的问题：在ARM32v6架构下编译cryptography库时，构建过程会无故挂起数小时。这个问题自2024年9月18日开始出现，影响了项目的持续集成流程。

问题背景

Let's Encrypt项目使用Docker的多平台构建功能，通过QEMU模拟器为不同架构（包括ARM32v6）构建镜像。在ARM32v6架构下，由于没有预编译的cryptography轮子(wheel)，需要从源代码编译。这一过程多年来一直正常工作，直到最近突然出现问题。

构建过程会在编译cryptography的Rust依赖时挂起，特别是在处理self_cell和once_cell等依赖项时。有趣的是，增加pip和cargo的日志详细程度(CARGO_LOG=trace CARGO_TERM_VERBOSE=true)似乎能显著提高构建成功率。

开发团队进行了多方面的排查：

环境变化检查：
- QEMU Docker镜像未变更
- 基础Python Alpine镜像和系统包未变更
- CI环境更新了Linux内核、Docker buildx和BuildKit版本
依赖关系分析：
- cryptography版本保持43.0.0不变
- maturin构建工具版本未发生关键变化
- Rust编译器版本稳定在1.71.1
构建行为观察：
- 失败案例中依赖项编译顺序与成功案例不同
- 某些关键依赖项在失败案例中缺失

经过深入调查，发现问题可能与以下因素有关：

开发团队探索了多种解决途径：

临时解决方案：
- 增加构建日志详细程度，意外发现能提高成功率
- 等待CI环境升级到Ubuntu 24，这似乎缓解了问题
长期解决方案：
- 考虑为ARM架构预编译cryptography轮子
- 探索直接使用ARM64主机构建ARMv7镜像的方案（不适用于ARMv6）
- 实现Rust构建缓存机制优化构建过程

这一问题的解决过程提供了宝贵的经验：

通过这一问题，Let's Encrypt团队加深了对跨平台构建复杂性的理解，并为未来处理类似问题积累了经验。目前问题已得到缓解，团队将继续监控构建稳定性，并在必要时实施更彻底的解决方案。

登录后查看全文