首页
/ AWS Deep Learning Containers发布PyTorch Graviton推理容器v1.31版本

AWS Deep Learning Containers发布PyTorch Graviton推理容器v1.31版本

2025-07-07 20:55:02作者:贡沫苏Truman

AWS Deep Learning Containers(DLC)是亚马逊云科技提供的一套预构建的深度学习容器镜像,它集成了主流深度学习框架和必要的依赖库,帮助开发者快速部署深度学习应用。这些容器经过AWS优化,可直接在Amazon EC2、Amazon ECS、Amazon EKS等云服务上运行。

近日,AWS发布了PyTorch Graviton推理容器的v1.31版本更新,该版本基于PyTorch 2.3.0构建,专为AWS Graviton处理器优化,适用于CPU推理场景。Graviton是AWS基于ARM架构自主研发的处理器系列,相比传统x86架构,在性价比和能效比方面具有显著优势。

核心特性与技术细节

此版本容器镜像基于Ubuntu 20.04操作系统,预装了Python 3.11环境,主要包含以下关键组件:

  1. PyTorch生态系统

    • PyTorch核心库:2.3.0+cpu版本
    • TorchVision:0.18.0+cpu
    • TorchAudio:2.3.0+cpu
    • 模型服务工具链:包括torchserve 0.11.0和torch-model-archiver 0.11.0
  2. 科学计算与数据处理

    • NumPy 1.26.4
    • Pandas 2.2.2
    • SciPy 1.14.0
    • scikit-learn 1.5.0
    • OpenCV-Python 4.10.0.84
  3. 开发与部署工具

    • AWS CLI 1.33.19
    • Boto3 1.34.137
    • Cython 3.0.10
    • Ninja构建系统 1.11.1.1

性能优化与兼容性

该容器针对Graviton处理器进行了深度优化,充分利用了ARM架构的优势。相比x86架构,Graviton处理器在相同成本下通常能提供更好的性能表现。容器中包含了必要的底层库支持,如:

  • GCC编译器相关库(libgcc-10-dev、libgcc-9-dev等)
  • C++标准库(libstdc++-10-dev、libstdc++-9-dev等)

这些底层库的优化确保了PyTorch在Graviton处理器上能够发挥最佳性能。同时,容器保持了良好的向后兼容性,可以运行大多数基于PyTorch 2.3.0的模型。

使用场景

这个版本的DLC容器特别适合以下场景:

  1. 成本敏感型推理服务:Graviton处理器相比传统x86实例通常能提供更好的性价比,适合大规模部署的推理服务。

  2. 边缘计算场景:ARM架构在能效比方面的优势使其成为边缘设备的理想选择。

  3. 模型服务化:内置的torchserve和model-archiver工具简化了模型部署和服务化流程。

  4. 数据预处理流水线:预装的Pandas、NumPy和OpenCV等库为数据预处理提供了完整支持。

总结

AWS Deep Learning Containers的这次更新为使用PyTorch进行CPU推理的用户提供了更多选择,特别是对于那些希望利用Graviton处理器成本优势的用户。容器预装了完整的工具链和依赖库,大大简化了深度学习模型的部署流程,使开发者能够专注于模型本身而非环境配置。

对于已经在使用AWS服务的PyTorch用户,这个容器版本提供了开箱即用的体验;对于考虑迁移到Graviton处理器的用户,这也是一个很好的测试平台。随着ARM生态的不断完善,这类优化容器将在AI推理领域发挥越来越重要的作用。

登录后查看全文

项目优选

收起
kernelkernel
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
471
466
kernelkernel
deepin linux kernel
C
32
16
atomcodeatomcode
Claude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started
Rust
2.09 K
218
ops-nnops-nn
本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。
C++
700
1.4 K
docsdocs
暂无描述
Dockerfile
780
5.08 K
pytorchpytorch
Ascend Extension for PyTorch
Python
758
968
flutter_flutterflutter_flutter
本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本,由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用,3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。
Dart
1.04 K
272
ops-transformerops-transformer
本项目是CANN提供的transformer类大模型算子库,实现网络在NPU上加速计算。
C++
880
2.02 K
mindquantummindquantum
MindQuantum is a general software library supporting the development of applications for quantum computation.
Python
183
112
openHiTLSopenHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
1.11 K
682