AWS Deep Learning Containers 发布 PyTorch Graviton 推理容器 v1.38 版本

2025-07-07 17:39:55作者：裴麒琰

AWS Deep Learning Containers（DLC）是亚马逊云科技提供的一系列预构建的深度学习容器镜像，这些镜像经过优化可以直接在AWS云平台上运行。这些容器集成了主流深度学习框架（如PyTorch、TensorFlow等）及其依赖项，使开发者能够快速部署深度学习应用而无需花费大量时间配置环境。

本次发布的v1.38版本专注于为基于Graviton处理器的ARM架构提供优化的PyTorch推理容器。Graviton是AWS自主研发的基于ARM架构的处理器，相比传统x86架构处理器，在性价比和能效比方面具有显著优势。这个新版本特别针对使用PyTorch 2.3.0框架进行模型推理的场景进行了优化。

关键特性与技术细节

该容器镜像基于Ubuntu 20.04操作系统构建，预装了Python 3.11环境，主要包含以下核心组件：

PyTorch生态系统：
- PyTorch 2.3.0（CPU版本）
- TorchVision 0.18.0
- TorchAudio 2.3.0
- TorchServe 0.11.0（模型服务框架）
- Torch Model Archiver 0.11.0（模型打包工具）
科学计算与数据处理：
- NumPy 1.26.4
- Pandas 2.2.2
- SciPy 1.14.0
- scikit-learn 1.5.0
- OpenCV 4.10.0.84
AWS工具集成：
- AWS CLI 1.33.19
- Boto3 1.34.137
- Botocore 1.34.137
- SageMaker PyTorch Inference 2.0.24
构建工具与依赖：
- Cython 3.0.10
- Ninja 1.11.1.1
- GCC相关库（针对ARM64架构优化）

技术优势与应用场景

这个容器镜像特别适合以下应用场景：

成本敏感的推理服务：Graviton处理器相比传统x86实例可节省高达40%的成本，特别适合大规模部署的推理服务。
边缘计算场景：ARM架构在能效比方面的优势使其成为边缘设备的理想选择，这个容器可以轻松部署到基于Graviton的边缘设备上。
SageMaker服务集成：预装了SageMaker PyTorch Inference工具包，可以无缝集成到AWS SageMaker服务中，简化模型部署流程。
计算机视觉应用：内置OpenCV和TorchVision库，为图像处理任务提供了完整的工具链。

版本管理与兼容性

该容器镜像提供了多个标签以满足不同用户的需求：

长期支持标签（如2.3-cpu-py311）
精确版本标签（如2.3.0-cpu-py311-ubuntu20.04-sagemaker）
时间戳标签（用于特定版本追踪）

这种灵活的标签策略既保证了生产环境的稳定性，又满足了开发测试环境对特定版本的需求。

总结

AWS Deep Learning Containers的这次更新为使用PyTorch框架的开发者提供了针对Graviton处理器的优化解决方案。通过预构建的容器镜像，开发者可以快速部署高效的推理服务，同时享受ARM架构带来的成本优势。特别是对于已经在使用AWS SageMaker服务的团队，这个容器可以显著简化模型部署流程，提高开发效率。

对于考虑从x86架构迁移到Graviton的用户，建议先进行性能基准测试，虽然Graviton在大多数场景下表现优异，但特定工作负载可能需要额外优化。AWS提供了完善的工具链和文档支持这类迁移工作。

deep-learning-containers

AWS Deep Learning Containers (DLCs) are a set of Docker images for training and serving models in TensorFlow, TensorFlow 2, PyTorch, and MXNet.

项目地址：https://gitcode.com/gh_mirrors/de/deep-learning-containers

登录后查看全文