IREE项目中动态维度处理问题的技术分析

2025-06-26 18:17:17作者：宣聪麟

问题背景

在IREE编译器处理ONNX模型转换过程中，当遇到同时包含静态和动态维度的张量连接(concat)操作时，会出现维度信息丢失的问题。具体表现为：一个预期输出类型为tensor<?x12xf32>的张量操作，在转换过程中被错误地处理为tensor<?x?xf32>，导致后续流程中出现维度不匹配的错误。

问题现象

原始IR中包含一个连接操作：

%concat = tensor.concat dim(0) %4, %cst : (tensor<?x?xf32>, tensor<3x12xf32>) -> tensor<?x12xf32>

经过转换后变为：

%10 = "flow.tensor.update"(...) -> tensor<?x?xf32>
%11 = "flow.tensor.update"(...) -> tensor<?x?xf32>

明显可以看到，原本确定的第二维度12在转换过程中丢失了，变成了完全动态的维度?。

技术分析

这个问题核心在于IREE的tensor到flow的转换过程中，对混合静态和动态维度的处理不够完善。具体来说：

维度信息传播不足：在连接操作中，虽然一个输入张量(tensor<3x12xf32>)具有完全静态的维度，但转换流程未能正确保留这些静态信息。
类型推导缺陷：flow.tensor.update操作在生成结果类型时，未能充分考虑输入张量的静态维度特性，导致静态信息被过度泛化为动态维度。
后续流程影响：这种维度信息的丢失会传递到后续操作，如Gather操作，最终导致workgroups分发时维度值不匹配的错误。

解决方案思路

要解决这个问题，需要从以下几个方向考虑：

增强类型推导：在tensor到flow的转换过程中，需要更精细地处理混合静态和动态维度的情况，确保静态维度信息能够正确保留。
操作语义保留：对于concat这类操作，应该特别处理其维度语义，确保连接后的维度特性能够正确反映在结果类型中。
验证机制：在转换流程中增加维度一致性的验证步骤，及早发现并报告维度信息丢失的问题。

影响范围

这个问题会影响所有需要处理以下情况的模型：

包含静态和动态维度混合的张量操作
特别是连接(concat)操作中同时包含静态和动态维度的输入
后续操作依赖这些维度信息的模型

总结

IREE在处理混合静态和动态维度的张量操作时，需要更加细致地维护维度信息。这个问题凸显了在编译器设计中，类型系统和维度信息传播的重要性。修复这一问题将提高IREE对复杂维度场景的处理能力，特别是对那些来自PyTorch等框架的模型中常见的混合维度情况。

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

Dart

1.04 K

271