AWS Deep Learning Containers 发布 DJL Inference 0.33.0 版本支持 LMI 15.0.0 和 CUDA 12.8

2025-07-07 17:42:38作者：龚格成

deep-learning-containers

One stop shop for running AI/ML on AWS.

项目地址：https://gitcode.com/gh_mirrors/de/deep-learning-containers

AWS Deep Learning Containers 是一个由亚马逊云科技维护的深度学习容器镜像项目，它为开发者提供了预配置的深度学习环境，包含了主流深度学习框架、工具和库的优化版本。这些容器镜像可以直接部署在AWS云平台上，大大简化了深度学习模型的训练和推理部署流程。

近日，该项目发布了 DJL Inference 0.33.0 版本，这是一个重要的更新版本，特别针对使用 LMI (Large Model Inference) 15.0.0 和 CUDA 12.8 的用户进行了优化。DJL (Deep Java Library) 是亚马逊开发的一个开源深度学习框架，它允许Java开发者轻松构建和部署深度学习模型。

核心特性与更新

这个版本最显著的特点是提供了对 CUDA 12.8 的完整支持。CUDA 12.8 是NVIDIA最新的并行计算平台和编程模型版本，为深度学习工作负载提供了更好的性能和兼容性。容器中包含了完整的CUDA工具链和库文件，包括：

cuda-command-line-tools-12-8
libcublas-12-8 和 libcublas-dev-12-8
libnccl-dev 和 libnccl2

这些底层库的更新为深度学习模型的推理提供了更高效的计算能力，特别是在处理大规模语言模型(Large Language Models)时表现更为突出。

软件栈组成

该容器镜像集成了当前主流的深度学习工具和框架：

PyTorch生态：包含了PyTorch 2.6.0、TorchVision 0.21.0和TorchAudio 2.6.0的完整套件，为计算机视觉和音频处理任务提供了强大的支持。
Transformer生态：集成了Hugging Face的Transformers 4.51.3、Tokenizers 0.21.1和Datasets 3.0.1库，方便开发者使用和微调预训练的语言模型。
数据处理工具：包含了Pandas 2.2.3、NumPy 1.26.4和SciPy 1.15.2等科学计算库，以及Scikit-learn 1.6.1机器学习工具包。
实用工具：提供了MPI4py 4.0.3用于并行计算，Ninja 1.11.1.4作为构建工具，以及AWS CLI 1.38.35用于云服务交互。

技术优势

这个版本的容器镜像经过AWS的专门优化，具有以下技术优势：

性能优化：针对AWS基础设施进行了深度优化，能够充分发挥EC2实例的计算潜力，特别是在使用GPU加速时。
稳定性保障：所有软件包版本都经过严格测试，确保相互兼容，减少了依赖冲突的风险。
开箱即用：预配置了完整的深度学习环境，开发者可以直接使用，无需花费时间在环境配置上。
可扩展性：支持从单机推理到分布式部署的各种场景，适合不同规模的模型部署需求。

适用场景

这个版本的容器镜像特别适合以下应用场景：

大规模语言模型的推理服务部署
计算机视觉应用的模型服务化
语音识别和处理系统的构建
需要快速原型设计和部署的AI应用开发

对于需要在AWS云平台上部署深度学习模型的团队来说，这个预配置的容器镜像可以显著降低运维复杂度，加快产品上线速度。开发者可以专注于模型开发和业务逻辑实现，而不必担心底层环境的兼容性和性能问题。

随着深度学习模型规模的不断扩大和计算需求的增长，这种经过优化的容器解决方案将变得越来越重要。AWS Deep Learning Containers项目的持续更新，为开发者提供了稳定可靠的深度学习基础设施支持。

deep-learning-containers

One stop shop for running AI/ML on AWS.

项目地址：https://gitcode.com/gh_mirrors/de/deep-learning-containers

登录后查看全文

项目优选

收起

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。

Oohos_react_native

React Native鸿蒙化仓库