AWS Deep Learning Containers发布DJL推理镜像v1.2版本支持NeuronX SDK 2.20.1

2025-07-07 12:28:12作者：邬祺芯Juliet

AWS Deep Learning Containers（DLC）项目为开发者提供了预构建的深度学习环境镜像，这些镜像经过优化并预装了常用的深度学习框架和工具，能够帮助开发者快速部署AI应用。本次发布的v1.2版本主要针对DJL（Deep Java Library）推理场景，特别集成了NeuronX SDK 2.20.1，为AWS Inferentia处理器提供了更好的支持。

镜像特性与内容

本次发布的Docker镜像基于DJL 0.30.0版本构建，主要面向推理场景，特别针对使用AWS Inferentia处理器的应用进行了优化。镜像中包含了完整的深度学习推理环境，预装了以下关键组件：

深度学习框架支持：集成了PyTorch 2.1.2和TorchVision 0.16.2，为计算机视觉等应用提供了基础支持。
Transformer模型支持：包含了Transformers 4.45.2库，支持最新的NLP模型推理。
数据处理工具：预装了Datasets 2.19.1、Pandas 2.2.3等数据处理库，方便进行输入输出数据处理。
AWS工具链：内置了boto3 1.35.95和awscli 1.36.36等AWS开发工具，便于与AWS服务集成。
NeuronX SDK 2.20.1：这是本次更新的重点，该SDK为AWS Inferentia处理器提供了底层支持，能够充分发挥硬件性能。

技术细节

镜像中的关键软件包版本经过精心选择，确保兼容性和稳定性：

Python生态：使用NumPy 1.25.2和SciPy 1.11.2等科学计算基础库
序列化工具：包含Protobuf 3.20.3和PyYAML 6.0.2
系统依赖：配置了GCC 11/12等编译器工具链

特别值得注意的是，该镜像针对AWS Inferentia处理器进行了深度优化，通过NeuronX SDK 2.20.1的支持，开发者可以轻松部署高性能的机器学习推理应用，获得显著的性能提升和成本优化。

应用场景

这个版本的DLC镜像特别适合以下场景：

需要高性能推理的AI服务部署
使用Transformer架构的NLP应用
计算机视觉相关的推理任务
需要利用AWS Inferentia处理器的应用

开发者可以直接使用这个预构建的镜像，省去了复杂的环境配置过程，快速将模型部署到生产环境。

总结

AWS Deep Learning Containers项目持续为开发者提供高质量的预构建环境，本次发布的DJL推理镜像v1.2版本，通过集成NeuronX SDK 2.20.1，进一步加强了对AWS Inferentia处理器的支持，为高性能AI推理应用提供了开箱即用的解决方案。开发者可以基于此镜像快速构建和部署AI服务，专注于业务逻辑开发而非环境配置。

deep-learning-containers

AWS Deep Learning Containers (DLCs) are a set of Docker images for training and serving models in TensorFlow, TensorFlow 2, PyTorch, and MXNet.

项目地址：https://gitcode.com/gh_mirrors/de/deep-learning-containers

登录后查看全文