oneDNN中如何在不同原语间复用scratchpad内存空间

2025-06-18 09:35:22作者：谭伦延

oneAPI Deep Neural Network Library (oneDNN)

项目地址：https://gitcode.com/gh_mirrors/on/oneDNN

在深度学习框架开发过程中，内存管理是一个关键的性能优化点。oneDNN作为英特尔推出的深度神经网络加速库，提供了scratchpad和workspace两种内存管理机制，开发者需要清楚理解它们的区别和使用场景。

scratchpad与workspace的区别

scratchpad是oneDNN原语执行过程中使用的临时内存缓冲区，具有以下特点：

生命周期仅限于单个原语执行期间
可以用于前向传播或反向传播
分配方式灵活，支持库管理和用户管理两种模式

而workspace则是专门为训练场景设计的共享内存区域：

在前向传播和对应的反向传播之间保持有效
必须在前向传播完成后保持不变
仅用于训练场景中前后传播需要共享数据的场合

scratchpad的复用机制

oneDNN提供了两种scratchpad管理模式，开发者可以根据需求选择：

库管理模式

这是默认模式，oneDNN库会自动管理scratchpad内存：

库负责分配和释放内存
开发者无需关心内存管理细节
适合大多数常规使用场景

用户管理模式

当需要更精细控制内存时，可以使用此模式：

开发者自行分配内存缓冲区
通过属性设置告知oneDNN使用用户提供的缓冲区
适合需要跨原语共享内存的高级优化场景

实际开发中的注意事项

在实现需要共享scratchpad的原语时，开发者应当注意：

明确内存的生命周期需求，选择合适的内存类型
如果确实需要跨原语共享临时内存，应使用用户管理的scratchpad模式
避免直接传递原始指针，而是通过oneDNN提供的属性机制进行配置
特别注意内存对齐和线程安全问题

最佳实践建议

对于大多数应用场景，推荐：

优先使用库管理的scratchpad模式
仅在确有性能优化需求时考虑用户管理模式
对于训练相关原语，使用workspace而非scratchpad来共享前后传播数据
通过性能分析确定内存使用瓶颈后再进行针对性优化

通过合理利用oneDNN提供的内存管理机制，开发者可以在保证代码稳定性的同时，充分发挥硬件性能潜力。

oneAPI Deep Neural Network Library (oneDNN)

项目地址：https://gitcode.com/gh_mirrors/on/oneDNN

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

flutter_flutter

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

ohos_react_native

React Native鸿蒙化仓库

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。