AWS Deep Learning Containers发布TensorFlow 2.18.0推理镜像

2025-07-07 08:14:47作者：卓炯娓

AWS Deep Learning Containers（DLC）是亚马逊云科技提供的预构建深度学习容器镜像，这些镜像经过优化，包含了流行的深度学习框架及其依赖项，使开发者能够快速部署深度学习工作负载。本次发布的v1.10版本主要针对TensorFlow 2.18.0推理场景，提供了CPU和GPU两种计算架构的容器镜像。

镜像特性与内容

本次发布的TensorFlow推理镜像基于Ubuntu 20.04操作系统构建，支持Python 3.10环境，主要包含以下两个版本：

CPU版本镜像：适用于不需要GPU加速的推理场景，包含了TensorFlow Serving API 2.18.0及相关依赖。镜像中预装了常用的Python包如boto3（1.36.4）、awscli（1.37.4）等，方便与AWS服务集成。
GPU版本镜像：针对CUDA 12.2环境优化，除了包含CPU版本的所有功能外，还集成了cuBLAS 12-2、cuDNN 8等GPU加速库，以及NCCL通信库，为分布式推理场景提供支持。

关键软件包版本

两个版本的镜像都包含了以下核心组件：

TensorFlow Serving API：2.18.0（GPU版本为tensorflow-serving-api-gpu）
Python基础环境：3.10
系统工具：包括emacs编辑器等开发工具
编译器支持：GCC 9系列工具链

技术细节与优化

系统层优化：镜像基于Ubuntu 20.04 LTS构建，确保了系统的稳定性和长期支持。系统库方面，选择了GCC 9系列编译器工具链，包括libgcc-9-dev和libstdc++-9-dev，为TensorFlow提供了良好的编译环境。
Python生态集成：预装了Cython（0.29.37）和setuptools（75.8.0）等构建工具，方便用户扩展功能。同时包含了PyYAML（6.0.2）和protobuf（4.25.5）等序列化工具，支持模型配置和数据交换。
AWS服务集成：内置了完整的AWS CLI工具链（awscli 1.37.4、boto3 1.36.4、botocore 1.36.4），使容器能够无缝与S3等AWS服务交互，简化了模型部署和数据加载流程。
GPU加速支持：GPU版本针对NVIDIA CUDA 12.2环境进行了深度优化，包含了cuDNN 8和NCCL库，充分发挥了现代GPU硬件的计算潜力，特别适合大规模模型推理场景。