AWS Deep Learning Containers发布PyTorch 2.5.1训练镜像

2025-07-07 22:37:03作者：秋阔奎Evelyn

AWS Deep Learning Containers（DLC）是亚马逊云科技提供的一系列预配置的Docker镜像，这些镜像包含了流行的深度学习框架及其依赖项，旨在简化机器学习环境的部署过程。这些容器镜像经过优化，可以直接在AWS云平台上运行，支持包括EC2、SageMaker和ECS等多种服务。

近日，AWS发布了PyTorch 2.5.1版本的训练容器镜像更新，为开发者提供了最新的PyTorch框架支持。这些镜像基于Ubuntu 22.04操作系统构建，支持Python 3.11环境，并针对CPU和GPU（CUDA 12.4）两种计算架构分别进行了优化。

镜像版本详情

本次发布的镜像包含两个主要版本：

CPU版本：763104351884.dkr.ecr.us-west-2.amazonaws.com/pytorch-training:2.5.1-cpu-py311-ubuntu22.04-sagemaker-v1.4
GPU版本：763104351884.dkr.ecr.us-west-2.amazonaws.com/pytorch-training:2.5.1-gpu-py311-cu124-ubuntu22.04-sagemaker-v1.4

这两个镜像都基于PyTorch 2.5.1框架构建，其中GPU版本支持CUDA 12.4计算架构，能够充分利用NVIDIA GPU的并行计算能力加速深度学习训练过程。

关键软件包版本

镜像中预装了丰富的Python软件包生态系统，为机器学习工作流提供了全面的支持：

核心框架：PyTorch 2.5.1、TorchVision 0.20.1、TorchAudio 2.5.1
数据处理：NumPy 1.26.4、Pandas 2.2.3、OpenCV 4.10.0
机器学习工具：scikit-learn 1.5.2、fastai 2.7.18、spaCy 3.7.5
AWS集成：boto3 1.35.63、sagemaker 2.233.0
实用工具：mpi4py 4.0.1（支持分布式训练）、protobuf 3.20.3

系统级优化

这些镜像在系统层面也进行了多项优化：

编译器支持：包含了GCC 11开发工具链（libgcc-11-dev）和C++标准库（libstdc++-11-dev），确保代码能够充分利用现代编译器的优化特性。
CUDA支持：GPU版本预装了CUDA 12.4工具包和cuDNN库，为深度学习计算提供了高效的GPU加速支持。
开发工具：镜像中还包含了Emacs等开发工具，方便开发者直接在容器中进行代码编辑和调试。