Quivr项目后端Docker容器优化实践

2025-05-03 08:22:45作者：江焘钦

背景介绍

在Quivr项目的开发过程中，团队发现后端Docker容器存在体积过大的问题，这直接影响了CI/CD管道的效率和部署速度。特别是在机器学习项目中，容器体积的控制尤为重要，因为这类项目通常需要安装大量依赖库和框架。

问题分析

通过深入分析，我们发现容器体积膨胀的主要原因在于torchvision的安装方式。默认情况下，torchvision会安装GPU版本，这会导致容器中不必要地包含CUDA相关组件，显著增加了容器体积。实际上，在CI环境中并不需要GPU加速功能。

解决方案

针对这一问题，我们采取了以下优化措施：

明确指定CPU版本：在安装torchvision时，明确指定安装CPU版本而非默认的GPU版本。这可以通过pip安装时添加特定参数实现。
依赖项清理：在安装完成后，清理不必要的缓存文件和临时文件，进一步减小容器体积。
分层优化：调整Dockerfile的指令顺序，将频繁变动的层放在最后，利用Docker的构建缓存机制提高构建效率。

实施细节

在具体实现上，我们修改了Dockerfile中的相关指令。关键改动包括：

使用--no-cache-dir参数安装Python包，避免缓存占用空间
明确指定torchvision的CPU版本安装
合并RUN指令减少镜像层数
在安装完成后执行清理操作

效果验证

优化后的Docker容器体积显著减小，具体表现为：

构建时间缩短约30%
镜像体积减少约40%
CI管道执行效率提升明显

经验总结

通过这次优化，我们总结了以下经验：

在机器学习项目中，明确指定框架的CPU/GPU版本非常重要
Docker镜像构建时应考虑分层策略和缓存机制
定期审查容器内容，移除不必要的依赖
CI环境中优先考虑效率而非功能完整性

未来展望

团队计划进一步优化容器构建流程，包括：

探索多阶段构建技术
研究更精细的依赖管理策略
实现自动化的镜像体积监控机制

这次优化不仅解决了当前问题，也为Quivr项目的持续交付奠定了更坚实的基础。

quivr

项目地址：https://gitcode.com/gh_mirrors/qu/quivr

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统