ONNXRuntime中XNNPACK执行提供程序在Android上的使用问题分析

2025-05-13 10:52:33作者：沈韬淼Beryl

背景介绍

ONNXRuntime是一个跨平台的机器学习推理引擎，支持多种硬件加速后端。XNNPACK是其中一种针对ARM架构优化的执行提供程序(Execution Provider)，特别适合在移动设备上运行神经网络模型。本文将分析在Android平台上使用XNNPACK执行提供程序时遇到的一个典型问题及其解决方案。

问题现象

开发者在Android平台上使用ONNXRuntime 1.20.0版本时，发现当尝试通过session_options.AppendExecutionProvider("XNNPACK")启用XNNPACK后端时，程序会意外终止且没有提供详细的错误信息。通过日志分析发现，该问题与模型中的Resize操作参数有关。

技术分析

XNNPACK执行提供程序特性

XNNPACK是专门为ARM处理器优化的神经网络算子库，具有以下特点：

针对ARM CPU指令集进行了深度优化
支持常见的神经网络算子
提供高效的并行计算能力
对移动设备有良好的功耗优化

问题根源

通过日志分析和技术验证，发现问题的根本原因是：

模型中的Resize操作使用了空的scales参数张量
XNNPACK后端在处理这种特殊情况时缺乏健壮性检查
导致在图形变换(GraphTransformer)阶段出现未处理的异常

日志关键信息解读

从崩溃日志中可以看到几个关键点：

程序在初始化阶段成功创建了XNNPACKExecutionProvider
在执行GraphTransformer阶段发生崩溃
崩溃前的最后操作是TransposeOptimizer
错误信息显示"terminating"，表明是未捕获的异常导致的终止

解决方案

针对这一问题，可以采取以下解决方案：

模型预处理方案：
- 在导出ONNX模型前，确保所有Resize操作的scales参数都有有效值
- 避免使用动态尺寸的Resize操作
运行时解决方案：
- 修改ONNXRuntime的XNNPACK包装层代码，增加对空张量的检查
- 为Resize操作添加默认参数处理逻辑
临时规避方案：
- 对于包含问题操作的模型，暂时使用CPU执行提供程序
- 等待官方修复后更新ONNXRuntime版本

最佳实践建议

在使用ONNXRuntime的XNNPACK后端时，建议遵循以下实践：

模型兼容性检查：
- 使用ONNXRuntime工具检查模型各算子对XNNPACK的支持情况
- 特别注意图像处理相关操作(如Resize、Pad等)的参数设置

渐进式启用策略：

// 先尝试使用XNNPACK
try {
    session_options.AppendExecutionProvider("XNNPACK");
} catch(...) {
    // 失败时回退到CPU
    session_options.AppendExecutionProvider("CPU");
}