ONNX Runtime在Raspberry Pi 4上的ARM64兼容性问题分析与解决方案

2025-05-13 20:04:49作者：卓艾滢Kingsley

microsoft/onnxruntime: 是一个用于运行各种机器学习模型的开源库。适合对机器学习和深度学习有兴趣的人，特别是在开发和部署机器学习模型时需要处理各种不同框架和算子的人。特点是支持多种机器学习框架和算子，包括 TensorFlow、PyTorch、Caffe 等，具有高性能和广泛的兼容性。

项目地址：https://gitcode.com/GitHub_Trending/on/onnxruntime

问题背景

在Raspberry Pi 4设备上运行最新版ONNX Runtime（1.21.0版本）时，用户报告了一个严重的兼容性问题。当尝试在Python环境中导入onnxruntime模块时，系统会抛出"Illegal instruction"（非法指令）错误，导致程序无法正常运行。这个问题特别出现在运行64位Raspberry Pi OS（基于Debian 12 "Bookworm"）的系统上，Python版本为3.11.2。

问题现象与重现

用户在全新安装的Raspberry Pi OS系统上，通过pip在虚拟环境中安装ONNX Runtime后，简单的导入操作就会触发非法指令错误。错误信息如下：

>>> import onnxruntime
Illegal instruction

通过系统调用追踪(strace)分析，可以看到程序在尝试执行某个特定内存地址(0x7f9a7028f4)的指令时，触发了SIGILL信号（信号码ILL_ILLOPC），表明处理器遇到了无法识别的指令操作码。

技术分析

根本原因

经过开发团队深入调查，发现问题源于ONNX Runtime 1.21.0版本中引入的一个优化特性（PR #23597）。该优化尝试使用ARM架构的fp16（半精度浮点）指令集来提高计算性能，但在某些ARM64处理器（特别是Raspberry Pi 4使用的Cortex-A72）上，这些指令可能不被完全支持或实现方式有差异。

调试信息解读

开发团队提供的调试版本输出了详细的CPU信息：

处理器型号：MIDR 0x410fd083（ARM Cortex-A72）
最大频率：1.8GHz
核心数：4个物理核心
关键警告：No SVE support on this machine（缺少可伸缩向量扩展支持）

堆栈跟踪显示错误发生在动态库加载阶段，具体是在初始化onnxruntime_pybind11_state模块时触发了非法指令。

解决方案

临时解决方案

在官方修复发布前，用户可以回退到1.20.1版本，该版本不存在此兼容性问题：

pip install onnxruntime==1.20.1

官方修复方案

开发团队迅速响应，通过PR #23978修复了此问题。修复后的版本（1.22.0.dev20250310006）已发布到测试通道，用户可以通过以下命令安装：

pip install coloredlogs flatbuffers numpy packaging protobuf sympy
pip install -i 测试源地址 onnxruntime==1.22.0.dev20250310006

技术建议

对于在ARM架构设备上部署ONNX Runtime的用户，建议：

版本选择：在生产环境中，优先选择经过充分测试的稳定版本
硬件兼容性测试：在新硬件平台上，应先进行基础功能测试
调试准备：遇到类似问题时，可收集以下信息帮助诊断：
- /proc/cpuinfo内容
- 完整的Python环境信息
- strace或gdb的调试输出

总结

这个案例展示了在跨平台机器学习推理框架开发中，硬件指令集兼容性的重要性。ONNX Runtime团队通过快速响应和修复，展现了良好的开源项目管理能力。对于边缘计算开发者而言，在类似Raspberry Pi这样的异构硬件上部署模型时，应当特别注意框架版本与硬件特性的匹配关系。

onnxruntime

项目地址：https://gitcode.com/GitHub_Trending/on/onnxruntime

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

nop-entropy

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

349

200

pytorch

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理

ONNX Runtime在Raspberry Pi 4上的ARM64兼容性问题分析与解决方案

问题背景

问题现象与重现

技术分析

根本原因

调试信息解读

解决方案

临时解决方案

官方修复方案

技术建议

总结

热门内容推荐

最新内容推荐

项目优选

ONNX Runtime在Raspberry Pi 4上的ARM64兼容性问题分析与解决方案

问题背景

问题现象与重现

技术分析

根本原因

调试信息解读

解决方案

临时解决方案

官方修复方案

技术建议

总结

相关内容推荐

热门内容推荐

最新内容推荐

项目优选