AWS Deep Learning Containers发布PyTorch ARM64 CPU推理镜像v1.5
2025-07-07 11:31:08作者:尤辰城Agatha
AWS Deep Learning Containers(DLC)是亚马逊云科技提供的一组经过优化的深度学习容器镜像,这些镜像预装了流行的深度学习框架及其依赖项,能够帮助开发者快速部署深度学习应用。这些容器镜像针对AWS基础设施进行了优化,支持多种计算实例类型,包括CPU和GPU实例。
近日,AWS Deep Learning Containers项目发布了针对ARM64架构的PyTorch推理镜像新版本v1.5。这个版本基于PyTorch 2.5.1框架构建,专门为ARM64架构的CPU实例优化,适用于在Amazon SageMaker等服务中部署PyTorch模型推理任务。
镜像技术细节
该镜像基于Ubuntu 22.04操作系统构建,预装了Python 3.11环境,包含了PyTorch 2.5.1及其相关生态工具链。主要组件版本如下:
- PyTorch核心框架:2.5.1+cpu
- TorchVision:0.20.1+cpu
- TorchAudio:2.5.1+cpu
- TorchServe模型服务框架:0.12.0
- Torch Model Archiver模型打包工具:0.12.0
除了PyTorch核心组件外,镜像还预装了常用的数据科学和机器学习库:
- NumPy 2.1.3:高性能科学计算库
- Pandas 2.2.3:数据处理和分析库
- scikit-learn 1.5.2:机器学习算法库
- OpenCV 4.10.0.84:计算机视觉库
- Pillow 11.0.0:图像处理库
环境配置与优化
这个ARM64架构的镜像针对AWS Graviton处理器等ARM架构CPU进行了优化。系统层面配置了:
- GCC 11开发工具链
- C++标准库(libstdc++)11版本
- 必要的系统工具和编辑器(如Emacs)
Python环境方面,除了预装的核心库外,还包含了:
- Cython 3.0.11:用于编写C扩展的Python工具
- Ninja 1.11.1.1:高效的构建系统
- FileLock 3.16.1:文件锁工具
- 最新的pip包管理工具
使用场景
这个PyTorch ARM64 CPU推理镜像特别适合以下场景:
- 需要在ARM架构处理器上运行PyTorch模型推理的应用
- 使用Amazon SageMaker服务部署PyTorch模型的场景
- 对成本敏感,希望利用ARM架构CPU性价比优势的项目
- 需要轻量级推理服务,不需要GPU加速的场景
版本兼容性
该镜像属于PyTorch 2.5.x系列,保持了与PyTorch 2.5版本的API兼容性。开发者可以放心使用PyTorch 2.5的特性,同时享受ARM架构带来的性能优势。
对于需要在AWS上部署PyTorch推理服务的开发者,这个经过优化的ARM64镜像提供了开箱即用的解决方案,可以显著减少环境配置时间,提高部署效率。
登录后查看全文
热门项目推荐
PaddleOCR-VLPaddleOCR-VL 是一款顶尖且资源高效的文档解析专用模型。其核心组件为 PaddleOCR-VL-0.9B,这是一款精简却功能强大的视觉语言模型(VLM)。该模型融合了 NaViT 风格的动态分辨率视觉编码器与 ERNIE-4.5-0.3B 语言模型,可实现精准的元素识别。Python00- DDeepSeek-V3.2-ExpDeepSeek-V3.2-Exp是DeepSeek推出的实验性模型,基于V3.1-Terminus架构,创新引入DeepSeek Sparse Attention稀疏注意力机制,在保持模型输出质量的同时,大幅提升长文本场景下的训练与推理效率。该模型在MMLU-Pro、GPQA-Diamond等多领域公开基准测试中表现与V3.1-Terminus相当,支持HuggingFace、SGLang、vLLM等多种本地运行方式,开源内核设计便于研究,采用MIT许可证。【此简介由AI生成】Python00
openPangu-Ultra-MoE-718B-V1.1昇腾原生的开源盘古 Ultra-MoE-718B-V1.1 语言模型Python00
HunyuanWorld-Mirror混元3D世界重建模型,支持多模态先验注入和多任务统一输出Python00
AI内容魔方AI内容专区,汇集全球AI开源项目,集结模块、可组合的内容,致力于分享、交流。03
Spark-Scilit-X1-13BFLYTEK Spark Scilit-X1-13B is based on the latest generation of iFLYTEK Foundation Model, and has been trained on multiple core tasks derived from scientific literature. As a large language model tailored for academic research scenarios, it has shown excellent performance in Paper Assisted Reading, Academic Translation, English Polishing, and Review Generation, aiming to provide efficient and accurate intelligent assistance for researchers, faculty members, and students.Python00
GOT-OCR-2.0-hf阶跃星辰StepFun推出的GOT-OCR-2.0-hf是一款强大的多语言OCR开源模型,支持从普通文档到复杂场景的文字识别。它能精准处理表格、图表、数学公式、几何图形甚至乐谱等特殊内容,输出结果可通过第三方工具渲染成多种格式。模型支持1024×1024高分辨率输入,具备多页批量处理、动态分块识别和交互式区域选择等创新功能,用户可通过坐标或颜色指定识别区域。基于Apache 2.0协议开源,提供Hugging Face演示和完整代码,适用于学术研究到工业应用的广泛场景,为OCR领域带来突破性解决方案。00- HHowToCook程序员在家做饭方法指南。Programmer's guide about how to cook at home (Chinese only).Dockerfile013
- PpathwayPathway is an open framework for high-throughput and low-latency real-time data processing.Python00
项目优选
收起
deepin linux kernel
C
23
6
OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
238
2.36 K
仓颉编程语言运行时与标准库。
Cangjie
122
95
暂无简介
Dart
539
117
仓颉编译器源码及 cjdb 调试工具。
C++
114
83
React Native鸿蒙化仓库
JavaScript
216
291
Ascend Extension for PyTorch
Python
77
109
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
995
588
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
568
113
LLVM 项目是一个模块化、可复用的编译器及工具链技术的集合。此fork用于添加仓颉编译器的功能,并支持仓颉编译器项目。
C++
32
25