ONNX Runtime 跨平台编译优化：解决ARM架构下的精简构建问题

2025-05-13 17:40:26作者：凤尚柏Louis

microsoft/onnxruntime: 是一个用于运行各种机器学习模型的开源库。适合对机器学习和深度学习有兴趣的人，特别是在开发和部署机器学习模型时需要处理各种不同框架和算子的人。特点是支持多种机器学习框架和算子，包括 TensorFlow、PyTorch、Caffe 等，具有高性能和广泛的兼容性。

项目地址：https://gitcode.com/GitHub_Trending/on/onnxruntime

在嵌入式AI应用开发中，资源受限环境下的模型部署一直是个挑战。本文将深入探讨如何为ARM架构设备构建精简版的ONNX Runtime运行时，特别针对构建过程中遇到的protobuf编译器权限问题提供解决方案。

精简构建的必要性

标准版ONNX Runtime运行时库体积较大（约50MB），这在资源受限的ARM嵌入式设备上可能无法接受。通过精简构建(minimal build)，开发者可以仅包含模型所需的运算符，显著减小运行时体积。

跨平台构建的关键配置

为ARM架构进行交叉编译时，需要特别注意以下配置要点：

工具链指定：必须正确配置CMAKE_TOOLCHAIN_FILE指向ARM交叉编译工具链
构建类型：使用MinSizeRel配置以优化体积
并行编译：启用parallel选项加速构建过程
共享库：build_shared_lib选项生成动态链接库

常见构建错误分析

在精简构建过程中，开发者常遇到protobuf编译器相关的权限错误。错误信息通常表现为：

gmake[2]: /path/to/protoc-3.21.12: Permission denied

这实际上是由于路径配置不当导致的。正确的做法是指向protoc可执行文件的完整路径，而不仅仅是包含目录。

两种解决方案

方案一：精确指定protoc路径

确保ONNX_CUSTOM_PROTOC_EXECUTABLE变量指向protoc可执行文件的完整路径，包括文件名：

/path/to/protoc-3.21.12/bin/protoc

方案二：使用vcpkg依赖管理

更推荐的方法是启用vcpkg自动管理依赖：

--use_vcpkg

这种方法无需手动指定protoc路径，由构建系统自动处理依赖关系，更加可靠。

精简构建最佳实践

通过模型分析生成required_operators.config文件
使用include_ops_by_config仅包含必要运算符
在资源受限设备上测试构建结果的内存占用
考虑使用strip等工具进一步优化库文件体积

总结

通过正确的配置和构建方法，开发者可以成功地为ARM架构设备生成精简版的ONNX Runtime运行时。这不仅解决了资源受限环境下的部署问题，也为嵌入式AI应用提供了更高效的执行环境。记住关键点：要么精确指定protoc路径，要么使用vcpkg自动管理依赖，这两种方法都能有效解决构建过程中的权限问题。

onnxruntime

项目地址：https://gitcode.com/GitHub_Trending/on/onnxruntime

登录后查看全文