ONNX Runtime在Qualcomm Android设备上使用QNN GPU后端崩溃问题解析

2025-05-13 01:21:18作者：伍希望

microsoft/onnxruntime: 是一个用于运行各种机器学习模型的开源库。适合对机器学习和深度学习有兴趣的人，特别是在开发和部署机器学习模型时需要处理各种不同框架和算子的人。特点是支持多种机器学习框架和算子，包括 TensorFlow、PyTorch、Caffe 等，具有高性能和广泛的兼容性。

项目地址：https://gitcode.com/GitHub_Trending/on/onnxruntime

问题背景

在Qualcomm Android设备(QCS610)上使用ONNX Runtime时，当尝试通过QNN执行提供程序(Execution Provider)的GPU后端运行MobileNet模型时，程序会崩溃并返回错误代码6999。值得注意的是，相同的模型在CPU后端(libQnnCpu.so)上可以正常运行。

技术分析

环境验证

开发者已通过平台验证工具确认：

设备支持QNN GPU后端
检测到OpenCL 2.0 Adreno(TM) 612驱动
核心版本为Adreno(TM) 608
所有单元测试均已通过

模型选择

根据Qualcomm的建议，选择了非量化(32位浮点)的MobileNet-v2模型，因为：

量化模型目前与GPU后端不兼容
模型输入输出均为float32格式

错误表现

日志显示：

节点分配验证通过，所有节点都正确放置在QNNExecutionProvider上
初始化阶段顺利完成
推理阶段开始时，在第一个GPU节点执行时立即崩溃
错误代码始终为6999，且不随模型或节点数量变化

可能原因

共享内存问题：GPU计算可能需要特定的内存共享机制，旧版本可能未正确实现
库版本兼容性：
- ONNX Runtime版本(1.20.1)可能不完全支持该设备
- QNN库(qairt 2.28.2.241116)可能存在已知问题
驱动层问题：虽然验证工具显示驱动正常，但实际运行时可能有细微差异
链接库缺失：可能缺少某些隐式依赖的供应商库

解决方案

开发者最终通过以下升级解决了问题：

将ONNX Runtime升级至1.21版本
将qairt升级至2.32版本

这表明问题很可能源于：

ONNX Runtime 1.21引入了对QNN共享内存的改进支持
新版qairt修复了特定设备的兼容性问题

技术建议

对于在移动设备上使用ONNX Runtime的开发者：

版本匹配：确保ONNX Runtime与QNN库版本严格匹配
模型格式：GPU后端必须使用非量化(32位浮点)模型
验证流程：即使平台验证通过，仍需实际运行测试
日志分析：启用详细日志有助于定位问题节点
升级策略：遇到类似问题时，优先考虑升级到最新稳定版本

结论

这个问题展示了在移动端部署机器学习模型时可能遇到的特定硬件兼容性问题。通过保持框架和库的最新版本，可以避免许多潜在的兼容性问题。对于Qualcomm设备上的QNN GPU后端使用，确保使用足够新的ONNX Runtime和qairt版本是关键。

microsoft/onnxruntime: 是一个用于运行各种机器学习模型的开源库。适合对机器学习和深度学习有兴趣的人，特别是在开发和部署机器学习模型时需要处理各种不同框架和算子的人。特点是支持多种机器学习框架和算子，包括 TensorFlow、PyTorch、Caffe 等，具有高性能和广泛的兼容性。

项目地址：https://gitcode.com/GitHub_Trending/on/onnxruntime

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

flutter_flutter

ohos_react_native

React Native鸿蒙化仓库

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解