ONNXRuntime中QLinearAdd算子的符号形状推断问题解析

2025-05-13 08:07:43作者：裴锟轩Denise

microsoft/onnxruntime: 是一个用于运行各种机器学习模型的开源库。适合对机器学习和深度学习有兴趣的人，特别是在开发和部署机器学习模型时需要处理各种不同框架和算子的人。特点是支持多种机器学习框架和算子，包括 TensorFlow、PyTorch、Caffe 等，具有高性能和广泛的兼容性。

项目地址：https://gitcode.com/GitHub_Trending/on/onnxruntime

在ONNXRuntime项目的开发过程中，我们遇到了一个关于QLinearAdd算子符号形状推断的技术问题。这个问题影响了我们对ONNX模型库中多个模型的完整支持。

问题背景

QLinearAdd是ONNXRuntime特有的量化加法算子，属于com.microsoft域。该算子在许多视觉分类模型中都有应用，例如AlexNet的量化版本。然而，当我们尝试使用symbolic_shape_infer.py工具对这些模型进行形状推断时，系统会抛出"Incomplete symbolic shape inference"错误。

技术分析

经过深入分析，我们发现问题的根源在于symbolic_shape_infer.py工具当前并未实现对QLinearAdd算子的形状推断支持。该工具主要用于处理标准ONNX算子，对于ONNXRuntime特有的算子如QLinearAdd，需要额外添加支持逻辑。

QLinearAdd算子的输入输出特性如下：

接受两个量化输入张量
产生一个量化输出张量
需要处理量化参数（scale和zero_point）
输出形状应与输入形状广播兼容

解决方案

为了解决这个问题，我们采取了以下技术方案：

在symbolic_shape_infer.py中添加QLinearAdd算子的形状推断逻辑
实现输入输出张量的形状广播兼容性检查
确保量化参数的正确传递
维护与标准Add算子相似的形状推断行为

实现细节

具体的实现需要考虑以下几个方面：

输入验证：确认输入张量的维度和形状是否兼容
广播规则：实现与标准Add算子一致的广播规则
量化参数处理：确保scale和zero_point参数的正确传递
输出形状推导：根据输入形状推导出正确的输出形状

影响评估

该问题的解决将带来以下积极影响：

支持更多ONNX模型库中的量化模型
提升ONNXRuntime对量化模型的处理能力
为后续其他特有算子的支持提供参考实现

结论

通过对QLinearAdd算子形状推断问题的分析和解决，我们不仅解决了当前的技术障碍，还为ONNXRuntime项目未来支持更多特有算子积累了宝贵经验。这一工作体现了开源社区协作解决技术问题的典型模式，也展示了ONNXRuntime项目在持续完善对量化模型支持方面的努力。

microsoft/onnxruntime: 是一个用于运行各种机器学习模型的开源库。适合对机器学习和深度学习有兴趣的人，特别是在开发和部署机器学习模型时需要处理各种不同框架和算子的人。特点是支持多种机器学习框架和算子，包括 TensorFlow、PyTorch、Caffe 等，具有高性能和广泛的兼容性。

项目地址：https://gitcode.com/GitHub_Trending/on/onnxruntime

登录后查看全文

热门内容推荐

1 【亲测免费】开源项目 `build-your-own-x` 使用指南 2 【亲测免费】探索科技之旅：《Build Your Own X》项目详解 3 GitHub_Trending/bu/build-your-own-x自动化：CI/CD流程在自制项目中的应用 4 从零打造智能家居系统：用build-your-own-x实现家庭自动化

项目优选

收起

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

flutter_flutter

deepin linux kernel

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

ohos_react_native

React Native鸿蒙化仓库

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

cangjie_compiler

仓颉编译器源码及 cjdb 调试工具。