AWS Deep Learning Containers发布PyTorch Graviton推理容器v1.30版本

2025-07-06 09:07:35作者：申梦珏Efrain

deep-learning-containers

AWS Deep Learning Containers (DLCs) are a set of Docker images for training and serving models in TensorFlow, TensorFlow 2, PyTorch, and MXNet.

项目地址：https://gitcode.com/gh_mirrors/de/deep-learning-containers

AWS Deep Learning Containers（DLC）是亚马逊云科技提供的一组经过优化的深度学习容器镜像，这些镜像预装了流行的深度学习框架及其依赖项，可以帮助开发者快速部署机器学习工作负载。这些容器针对AWS基础设施进行了性能优化，支持多种计算实例类型，包括最新的Graviton处理器。

近日，AWS发布了PyTorch推理容器的Graviton版本v1.30，该版本基于PyTorch 2.4.0框架构建，专为使用ARM架构的Graviton处理器优化。这个版本特别值得关注的是它采用了Python 3.11作为基础运行环境，并基于Ubuntu 22.04操作系统，为机器学习推理任务提供了稳定且高效的运行平台。

容器镜像技术细节

这个版本的容器镜像包含了PyTorch 2.4.0及其相关生态系统组件，如torchvision 0.19.0和torchaudio 2.4.0。值得注意的是，这是针对CPU优化的版本，特别适合在AWS Graviton实例上运行PyTorch推理工作负载。

容器内预装的关键Python包包括：

数据处理与分析：NumPy 1.26.4、Pandas 2.2.3、SciPy 1.14.1
计算机视觉：OpenCV 4.10.0.84、Pillow 11.0.0
机器学习工具：scikit-learn 1.5.2
AWS工具集：boto3 1.35.47、awscli 1.35.13
模型服务：torchserve 0.12.0、torch-model-archiver 0.12.0

在系统层面，容器基于Ubuntu 22.04构建，包含了必要的系统库如libgcc和libstdc++的多个版本，确保兼容性。有趣的是，容器中还包含了完整的Emacs编辑器套件，为开发者提供了便利的开发环境。

版本管理与标签策略

AWS为这个容器镜像提供了多个语义化标签，方便用户根据不同的使用场景选择合适的版本：

主版本标签：2.4-cpu-py311
完整版本标签：2.4.0-cpu-py311-ubuntu22.04-sagemaker
带构建日期的详细标签：2.4.0-cpu-py311-ubuntu22.04-sagemaker-v1.30-2025-05-08-21-02-52

这种灵活的标签策略既方便用户锁定特定版本，又便于追踪构建历史，体现了AWS对容器版本管理的严谨态度。

技术价值与应用场景

这个Graviton优化的PyTorch推理容器特别适合以下场景：

成本敏感的推理工作负载：Graviton实例通常提供更好的性价比，结合这个优化容器可以进一步降低成本
边缘计算场景：ARM架构的能效优势使其适合边缘部署
需要Python 3.11新特性的项目：容器提供了最新的Python运行时环境
SageMaker服务用户：容器针对SageMaker服务进行了特别优化

对于考虑从x86架构迁移到Graviton的用户，这个容器提供了平滑过渡的解决方案。AWS的持续优化确保了在Graviton处理器上运行的PyTorch工作负载能够获得接近甚至超越x86实例的性能表现。

随着ARM架构在云计算领域的普及，这类针对特定硬件优化的容器镜像将成为机器学习部署的重要工具，帮助开发者充分发挥硬件潜力，同时降低运营成本。

deep-learning-containers

AWS Deep Learning Containers (DLCs) are a set of Docker images for training and serving models in TensorFlow, TensorFlow 2, PyTorch, and MXNet.

项目地址：https://gitcode.com/gh_mirrors/de/deep-learning-containers

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

昇腾LLM分布式训练框架

flutter_flutter

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统