AWS Deep Learning Containers发布PyTorch 2.5.1推理镜像

2025-07-07 20:39:05作者：戚魁泉Nursing

deep-learning-containers

One stop shop for running AI/ML on AWS.

项目地址：https://gitcode.com/gh_mirrors/de/deep-learning-containers

AWS Deep Learning Containers（DLC）是亚马逊云科技提供的预构建深度学习容器镜像，这些镜像经过优化和测试，可直接用于训练和推理任务。它们集成了流行的深度学习框架、工具和库，帮助开发者快速部署深度学习应用，而无需花费大量时间在环境配置上。

近日，AWS DLC项目发布了PyTorch 2.5.1推理专用镜像的两个新版本，分别支持CPU和GPU环境。这些镜像基于Ubuntu 22.04操作系统，并预装了Python 3.11环境，为开发者提供了开箱即用的PyTorch推理环境。

镜像版本详情

CPU版本镜像

CPU版本镜像（pytorch-inference:2.5.1-cpu-py311-ubuntu22.04-sagemaker-v1.8）专为无GPU环境设计，包含了PyTorch 2.5.1的CPU版本及其相关生态组件。主要特点包括：

基础环境：Ubuntu 22.04操作系统
Python版本：3.11
核心框架：PyTorch 2.5.1（CPU版本）
配套工具：torchvision 0.20.1、torchaudio 2.5.1
模型服务：torchserve 0.12.0和torch-model-archiver 0.12.0
科学计算库：NumPy 2.1.3、SciPy 1.14.1、pandas 2.2.3
图像处理：OpenCV 4.10.0.84、Pillow 11.0.0
机器学习：scikit-learn 1.5.2

GPU版本镜像

GPU版本镜像（pytorch-inference:2.5.1-gpu-py311-cu124-ubuntu22.04-sagemaker-v1.8）针对CUDA 12.4环境进行了优化，包含以下关键组件：

CUDA支持：12.4版本
cuDNN：9.x版本
核心框架：PyTorch 2.5.1（CUDA 12.4版本）
其他组件与CPU版本保持同步，确保开发体验一致

技术亮点

Python 3.11支持：两个镜像均基于Python 3.11构建，充分利用了新版本Python的性能改进和特性。
PyTorch生态系统完整性：除了核心PyTorch框架外，镜像还包含了完整的PyTorch生态系统工具，如torchserve模型服务框架和torch-model-archiver模型打包工具，方便生产环境部署。
科学计算全栈支持：预装了从数据处理（pandas）到科学计算（NumPy、SciPy）再到机器学习（scikit-learn）的全套工具链，满足各类深度学习应用场景需求。
生产就绪：包含了AWS CLI、boto3等AWS工具，便于与AWS云服务集成，同时预装了常用开发工具如emacs。
版本一致性：CPU和GPU版本的配套库版本保持一致（如torchvision、torchaudio等），确保代码在不同环境间迁移时行为一致。

应用场景

这些预构建的PyTorch推理镜像特别适合以下场景：

模型即服务部署：使用内置的torchserve框架快速将训练好的PyTorch模型部署为RESTful服务。
批量推理任务：利用预装的科学计算库处理大规模数据推理任务。
云原生应用：在AWS SageMaker等云服务上快速构建和部署深度学习应用。
开发测试环境：为团队提供一致的开发环境，避免"在我机器上能运行"的问题。

AWS Deep Learning Containers的这些新版本镜像，通过提供经过充分测试和优化的PyTorch环境，显著降低了开发者部署深度学习应用的门槛，让团队可以更专注于模型开发和业务逻辑实现，而非基础环境配置。

deep-learning-containers

One stop shop for running AI/ML on AWS.

项目地址：https://gitcode.com/gh_mirrors/de/deep-learning-containers

登录后查看全文

项目优选

收起

deepin linux kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

昇腾LLM分布式训练框架

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。