AWS Deep Learning Containers发布PyTorch Graviton推理容器v1.31版本

2025-07-07 20:55:02作者：贡沫苏Truman

deep-learning-containers

One stop shop for running AI/ML on AWS.

项目地址：https://gitcode.com/gh_mirrors/de/deep-learning-containers

AWS Deep Learning Containers（DLC）是亚马逊云科技提供的一套预构建的深度学习容器镜像，它集成了主流深度学习框架和必要的依赖库，帮助开发者快速部署深度学习应用。这些容器经过AWS优化，可直接在Amazon EC2、Amazon ECS、Amazon EKS等云服务上运行。

近日，AWS发布了PyTorch Graviton推理容器的v1.31版本更新，该版本基于PyTorch 2.3.0构建，专为AWS Graviton处理器优化，适用于CPU推理场景。Graviton是AWS基于ARM架构自主研发的处理器系列，相比传统x86架构，在性价比和能效比方面具有显著优势。

核心特性与技术细节

此版本容器镜像基于Ubuntu 20.04操作系统，预装了Python 3.11环境，主要包含以下关键组件：

PyTorch生态系统：
- PyTorch核心库：2.3.0+cpu版本
- TorchVision：0.18.0+cpu
- TorchAudio：2.3.0+cpu
- 模型服务工具链：包括torchserve 0.11.0和torch-model-archiver 0.11.0
科学计算与数据处理：
- NumPy 1.26.4
- Pandas 2.2.2
- SciPy 1.14.0
- scikit-learn 1.5.0
- OpenCV-Python 4.10.0.84
开发与部署工具：
- AWS CLI 1.33.19
- Boto3 1.34.137
- Cython 3.0.10
- Ninja构建系统 1.11.1.1

性能优化与兼容性

该容器针对Graviton处理器进行了深度优化，充分利用了ARM架构的优势。相比x86架构，Graviton处理器在相同成本下通常能提供更好的性能表现。容器中包含了必要的底层库支持，如：

GCC编译器相关库（libgcc-10-dev、libgcc-9-dev等）
C++标准库（libstdc++-10-dev、libstdc++-9-dev等）

这些底层库的优化确保了PyTorch在Graviton处理器上能够发挥最佳性能。同时，容器保持了良好的向后兼容性，可以运行大多数基于PyTorch 2.3.0的模型。

使用场景

这个版本的DLC容器特别适合以下场景：

成本敏感型推理服务：Graviton处理器相比传统x86实例通常能提供更好的性价比，适合大规模部署的推理服务。
边缘计算场景：ARM架构在能效比方面的优势使其成为边缘设备的理想选择。
模型服务化：内置的torchserve和model-archiver工具简化了模型部署和服务化流程。
数据预处理流水线：预装的Pandas、NumPy和OpenCV等库为数据预处理提供了完整支持。

总结

AWS Deep Learning Containers的这次更新为使用PyTorch进行CPU推理的用户提供了更多选择，特别是对于那些希望利用Graviton处理器成本优势的用户。容器预装了完整的工具链和依赖库，大大简化了深度学习模型的部署流程，使开发者能够专注于模型本身而非环境配置。

对于已经在使用AWS服务的PyTorch用户，这个容器版本提供了开箱即用的体验；对于考虑迁移到Graviton处理器的用户，这也是一个很好的测试平台。随着ARM生态的不断完善，这类优化容器将在AI推理领域发挥越来越重要的作用。

deep-learning-containers

One stop shop for running AI/ML on AWS.

项目地址：https://gitcode.com/gh_mirrors/de/deep-learning-containers

登录后查看全文

项目优选

收起

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

deepin linux kernel

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

MindQuantum is a general software library supporting the development of applications for quantum computation.

旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件，通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求，让密码技术应用更简单，同时探索后量子等先进算法创新实践，构建密码前沿技术底座！