Autoware项目ARM64架构Docker构建中的磁盘空间问题分析与解决

2025-05-24 18:36:59作者：宗隆裙

探索自动驾驶的未来，加入Autoware开源社区！这个基于ROS的自驾驶软件栈涵盖了从定位、物体检测到路径规划和控制的所有核心功能。无论你是开发者还是研究者，都能在这里贡献力量，推动开放创新。Autoware分为稳定的核心和实验性的Universe仓库，满足不同需求。文档齐全，支持轻松上手和扩展。立即参与，共绘智能出行新篇章！

项目地址：https://gitcode.com/gh_mirrors/aut/Autoware

问题背景

在Autoware项目的持续集成流程中，ARM64架构的Docker镜像构建工作流频繁出现"磁盘空间不足"的错误。这一问题主要发生在使用AWS自托管运行器的ARM64架构环境中，与GitHub托管的AMD64运行器相比，ARM64运行器的可用磁盘空间明显不足。

问题现象分析

通过对比两种运行环境的磁盘使用情况，我们发现：

AMD64平台（GitHub托管运行器）
- 初始状态：73GB总空间，已用52GB，剩余22GB
- 执行清理后：剩余空间提升至53GB
ARM64平台（AWS自托管运行器）
- 初始状态：97GB总空间，已用56GB，剩余41GB
- 执行清理后：剩余空间仍为41GB，清理效果不明显

根本原因

深入调查后发现，问题主要由以下几个因素导致：

Docker构建缓存积累
- 多个buildx构建缓存卷占用大量空间（单个缓存卷可达9GB）
- 旧版Docker镜像、容器和卷未被及时清理
工作目录残留
- 多次构建后工作目录中积累了多个版本的代码仓库
- 单个工作目录占用空间可达7GB
ARM64构建特殊性
- ARM64架构的交叉编译和模拟构建会产生更多中间文件
- 相比原生AMD64构建，需要更多临时空间

解决方案

针对上述问题，我们实施了多层次的解决方案：

基础设施扩容
- 将AWS EBS卷从100GB扩容至200GB
- 实际可用空间提升至194GB
构建环境清理优化
- 定期清理Docker构建缓存和残留卷
- 实现工作目录的自动清理机制
- 在作业前后执行预定义清理脚本
监控机制建立
- 实施磁盘空间使用监控
- 设置预警阈值，防止空间再次耗尽

实施效果

扩容后，ARM64运行器的磁盘使用情况显著改善：

总空间：194GB
已用空间：23GB
剩余空间：171GB
使用率：12%

即使在构建最耗资源的CUDA相关作业时，也能顺利完成，不再出现空间不足的问题。

经验总结

ARM64构建环境特殊性：需要比AMD64环境预留更多磁盘空间
缓存管理重要性：构建缓存既能加速构建，也可能成为空间消耗的主要因素
预防性维护：定期清理比被动响应更有效
监控先行：资源使用监控应作为CI/CD环境的基础设施

这一问题的解决不仅保障了Autoware项目ARM64架构的持续集成流程，也为其他面临类似问题的开源项目提供了有价值的参考案例。

探索自动驾驶的未来，加入Autoware开源社区！这个基于ROS的自驾驶软件栈涵盖了从定位、物体检测到路径规划和控制的所有核心功能。无论你是开发者还是研究者，都能在这里贡献力量，推动开放创新。Autoware分为稳定的核心和实验性的Universe仓库，满足不同需求。文档齐全，支持轻松上手和扩展。立即参与，共绘智能出行新篇章！

项目地址：https://gitcode.com/gh_mirrors/aut/Autoware

登录后查看全文

热门内容推荐

1 【亲测免费】开源项目 `build-your-own-x` 使用指南 2 【亲测免费】探索科技之旅：《Build Your Own X》项目详解 3 GitHub_Trending/bu/build-your-own-x自动化：CI/CD流程在自制项目中的应用 4 从零打造智能家居系统：用build-your-own-x实现家庭自动化

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

openGauss-server

openGauss kernel ~ openGauss is an open source relational database management system

flutter_flutter

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统