AWS Deep Learning Containers发布PyTorch Graviton推理容器v1.28版本

2025-07-06 19:45:02作者：平淮齐Percy

deep-learning-containers

AWS Deep Learning Containers (DLCs) are a set of Docker images for training and serving models in TensorFlow, TensorFlow 2, PyTorch, and MXNet.

项目地址：https://gitcode.com/gh_mirrors/de/deep-learning-containers

AWS Deep Learning Containers（DLC）是亚马逊云科技提供的一组经过优化的深度学习容器镜像，这些镜像预装了流行的深度学习框架及其依赖项，可以帮助开发者快速部署机器学习工作负载。DLC支持多种深度学习框架，包括PyTorch、TensorFlow和MXNet等，并针对AWS基础设施进行了性能优化。

近日，AWS发布了PyTorch Graviton推理容器的v1.28版本，该版本基于PyTorch 2.4.0构建，专为使用AWS Graviton处理器的环境优化。Graviton处理器是AWS基于ARM架构自主研发的云服务器处理器，相比传统x86架构处理器，在性能和成本效益方面都有显著优势。

版本核心特性

这个新发布的容器镜像具有以下主要技术特性：

PyTorch 2.4.0支持：集成了PyTorch框架的最新稳定版本2.4.0，包含所有最新的功能和性能改进。
Graviton处理器优化：专门为AWS Graviton ARM架构处理器优化，能够充分发挥ARM架构的性能优势。
Python 3.11环境：基于Python 3.11构建，这是目前Python的最新稳定版本之一，提供了更好的性能和语言特性支持。
Ubuntu 22.04基础：使用Ubuntu 22.04 LTS作为基础操作系统，确保系统稳定性和长期支持。
SageMaker兼容：专为Amazon SageMaker服务优化，可以无缝集成到SageMaker的机器学习工作流中。

包含的关键软件包

该容器镜像预装了丰富的软件包，方便开发者直接使用：

深度学习框架：PyTorch 2.4.0（CPU版本）、TorchVision 0.19.0、TorchAudio 2.4.0
模型服务工具：TorchServe 0.12.0和Torch Model Archiver 0.12.0，用于模型部署和服务
数据处理库：NumPy 1.26.4、Pandas 2.2.3、OpenCV 4.10.0.84
机器学习工具：scikit-learn 1.5.2、SciPy 1.14.1
开发工具：Cython 3.0.11、Ninja 1.11.1.1构建系统
AWS集成：boto3 1.35.47、botocore 1.35.47、awscli 1.35.13

技术优势

使用这个专门为Graviton优化的PyTorch容器镜像，开发者可以获得以下优势：

成本效益：Graviton实例通常比同级别的x86实例价格更低，使用这个优化镜像可以进一步降低机器学习推理的成本。
性能优化：针对ARM架构的专门优化可以带来更好的性能表现，特别是在推理工作负载上。
开箱即用：预装了所有必要的依赖项和工具，开发者可以专注于模型开发和部署，而不需要花费时间在环境配置上。
生态系统兼容：与AWS SageMaker服务深度集成，可以轻松地将模型部署到生产环境。
安全稳定：基于Ubuntu 22.04 LTS，提供长期安全更新支持，确保生产环境的稳定性。

适用场景

这个PyTorch Graviton推理容器特别适合以下应用场景：

大规模推理服务：需要高效、低成本运行大量推理请求的生产环境。
边缘计算：结合AWS Outposts或边缘服务，在靠近数据源的位置进行推理。
成本敏感型项目：预算有限但需要可靠机器学习服务的应用场景。
ARM原生开发：为ARM架构开发和优化机器学习模型的工作流程。
SageMaker模型部署：在Amazon SageMaker服务中部署PyTorch模型。

AWS Deep Learning Containers的持续更新反映了AWS对机器学习基础设施的重视，这个针对Graviton优化的PyTorch容器版本为开发者提供了更多架构选择和性能优化可能，是构建高效、经济机器学习解决方案的重要工具。

deep-learning-containers

AWS Deep Learning Containers (DLCs) are a set of Docker images for training and serving models in TensorFlow, TensorFlow 2, PyTorch, and MXNet.

项目地址：https://gitcode.com/gh_mirrors/de/deep-learning-containers

登录后查看全文

最新内容推荐

TJSONObject完整解析教程：Delphi开发者必备的JSON处理指南 32位ECC纠错Verilog代码：提升FPGA系统可靠性的关键技术方案 TortoiseSVN 1.14.5.29465 中文版：高效版本控制的终极解决方案全球GEOJSON地理数据资源下载指南 - 高效获取地理空间数据的完整解决方案 JDK 8u381 Windows x64 安装包：企业级Java开发环境的完美选择 Windows Server 2016 .NET Framework 3.5 SXS文件下载与安装完整指南 IK分词器elasticsearch-analysis-ik-7.17.16：中文文本分析的最佳解决方案 QT连接阿里云MySQL数据库完整指南：从环境配置到问题解决 ONVIF设备模拟器：开发测试必备的智能安防仿真工具 STM32到GD32项目移植完全指南：从兼容性到实战技巧

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

Ascend Extension for PyTorch

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

ohos_react_native

React Native鸿蒙化仓库

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。