ArmNN SDK v25.02 版本深度解析与特性详解

2025-07-03 06:52:11作者：羿妍玫Ivan

项目概述

ArmNN 是 Arm 公司推出的神经网络推理引擎，专为机器学习工作负载优化设计。作为连接机器学习框架与 Arm 处理器的桥梁，ArmNN 提供了高效的神经网络模型执行能力，支持多种主流机器学习框架的模型格式，能够在 Arm Cortex-A、Cortex-M 和 Mali GPU 等处理器上实现高性能推理。

版本核心更新

关键错误修复

本次 v25.02 版本针对 TosaRef 后端进行了多项重要修复：

运算符映射修复：解决了 LeakyRelu、Quantize、Stack 和 Dequantize 等关键运算符在 TosaRef 后端中的映射问题，提升了模型转换的准确性和兼容性。
架构重构优化：对 TosaRef 后端进行了全面的重构，修复了多个运算符的实现问题，显著提升了后端稳定性和执行效率。
切片操作修正：修复了 TosaRef 中 Strided Slice 操作的错误，确保了张量切片操作的正确性。
模型检测增强：改进了 TfLite Turbo 模型的检测机制，能够更准确地识别和优化这类模型。
子图安全验证：在 Neon 和 CL 后端中增加了激活函数融合前的子图验证检查，防止了跨子图的不安全融合操作。

移除的功能特性

为简化代码库和优化维护成本，本版本移除了以下功能组件：

异步执行接口：移除了完整的异步 API 实现，包括 IWorkingMemHandle 和 IAsyncExecutionCallback 等核心接口类。
Python 绑定：移除了 PyArmNN Python 接口支持，专注于核心 C++ 实现。
支持库组件：移除了 Shim 层和支持库实现，精简了代码结构。
范围追踪工具：移除了 RangeTracker 类及其相关功能。

重要 API/ABI 变更

v25.02 版本包含了重大的 API 变更，版本号升级至 35.0.0（遵循语义化版本规范）。开发者需要特别注意以下变更点：

异步执行相关接口移除：
- 删除了 IWorkingMemHandle 和 IAsyncExecutionCallback 接口类
- 移除了 INetworkProperties 中的 m_AsyncEnabled 标志
- 删除了 IRuntime 接口中的 4 个异步执行相关方法
线程池组件移除：
- 完整移除了 Threadpool 类及其所有成员函数
- 移除了与工作内存句柄管理相关的接口

构建环境要求

v25.02 版本对构建工具链和依赖库提出了明确要求：

核心工具链

Git：2.17.1 或更高版本
SCons：Ubuntu 2.4.1 / Debian 2.5.1
CMake：最低 3.22.1 版本

框架支持

TensorFlow：2.15.0 版本
ONNX：1.6.0 版本
Flatbuffer：23.5.26 版本
Protobuf：3.12.0 版本

关键依赖库

Android NDK：r26b 版本
数学计算库：Gemmlowp（特定提交版本）
工具库：包括 cxxopts、doctest、fmt 等均有明确版本要求

技术影响与升级建议

迁移注意事项：
- 使用过异步 API 的应用需要重构为同步执行模式
- Python 用户需要寻找替代方案或考虑直接使用 C++ 接口
- 检查构建系统是否满足新版依赖要求
性能优化方向：
- TosaRef 后端的稳定性提升为量化模型带来更好的支持
- 子图验证机制增强了优化过程的安全性
长期维护价值：
- 精简后的代码库更易于维护和扩展
- 明确的版本依赖降低了环境配置复杂度