AWS Deep Learning Containers发布新版HuggingFace PyTorch推理镜像支持NeuronX SDK

2025-07-07 14:42:16作者：董斯意

AWS Deep Learning Containers是亚马逊云科技提供的一套预构建的深度学习容器镜像，旨在简化深度学习模型的训练和部署过程。这些容器镜像经过优化，可以直接在AWS云平台上使用，特别是与Amazon SageMaker服务深度集成。

本次发布的v2.3-hf-4.43.2-pt-2.1.2-inf-neuronx-sdk2.20.0-py310版本主要针对HuggingFace PyTorch推理场景进行了专项优化，特别值得关注的是其对AWS NeuronX SDK 2.20.0的支持。NeuronX是AWS专为机器学习推理加速设计的SDK，能够充分发挥AWS Inferentia和Trainium芯片的性能优势。

该容器镜像基于Ubuntu 20.04操作系统构建，预装了Python 3.10环境，核心组件包括PyTorch 2.1.2和HuggingFace Transformers 4.43.2。这些版本的精心组合确保了用户在AWS基础设施上能够获得最佳的模型推理性能。

镜像中集成了丰富的机器学习相关库，包括数据处理工具如pandas 1.5.3和scikit-learn 1.6.1，计算机视觉库opencv-python 4.11.0.86，以及自然语言处理相关的tokenizers 0.19.1和sentencepiece 0.2.0等。这些预装组件大大简化了用户的开发环境配置工作。

对于需要高性能推理的用户，该镜像特别优化了对NeuronX SDK 2.20.0的支持。NeuronX SDK提供了针对AWS Inferentia芯片的深度优化，能够显著提升模型推理效率，降低延迟和成本。结合PyTorch和HuggingFace Transformers的使用，开发者可以轻松地将现有模型迁移到AWS Inferentia硬件上运行。

值得注意的是，该镜像还包含了AWS CLI工具和boto3库，方便用户与AWS服务进行交互。同时集成了multi-model-server 1.1.11，支持多模型服务部署场景。

AWS Deep Learning Containers的这种定期更新机制，确保了用户始终能够使用到最新优化的深度学习工具链，同时保持与AWS硬件创新的同步。对于在AWS平台上部署HuggingFace模型的用户来说，这个新版本提供了更高效的推理能力和更完善的开发体验。

deep-learning-containers

AWS Deep Learning Containers (DLCs) are a set of Docker images for training and serving models in TensorFlow, TensorFlow 2, PyTorch, and MXNet.

项目地址：https://gitcode.com/gh_mirrors/de/deep-learning-containers

登录后查看全文