IREE项目中卷积运算转换为IGEMM时的维度处理问题分析

2025-06-26 23:25:44作者：俞予舒Fleming

问题背景

在IREE编译器项目中，当将卷积运算转换为IGEMM（整数矩阵乘法）形式时，存在一个关于维度处理的潜在问题。该问题主要出现在处理具有非单位滤波器维度的卷积运算时，特别是在将命名卷积操作转换为通用操作后。

技术细节

问题的核心在于im2col操作对输入张量维度的处理方式。当卷积运算的滤波器维度中存在单位维度时，系统会尝试将这些单位维度折叠，这可能导致维度顺序的意外变化。

在具体案例中，输入张量的形状为16x26x16x96（NxHxWxC），滤波器形状为96x3x1x96。由于第二个滤波器维度为1，系统将其视为1D卷积而非2D卷积，导致输出形状被错误地转置为16x16x24x288，而非预期的16x24x16x288。

问题根源

深入分析发现，问题主要源于以下几个方面：

维度推断逻辑：当滤波器存在单位维度时，系统会将其折叠，导致卷积维度推断出现偏差。
im2col操作处理：im2col操作将批处理维度移到外部时，没有正确考虑输出形状的维度顺序。
工作组分块策略：后续的矩阵乘法操作中，工作组分块策略没有适应维度顺序的变化，导致共享内存使用超出限制。

解决方案

针对这一问题，开发团队提出了以下解决方案：

调整输出索引映射：修改im2col操作的输出索引映射，确保维度顺序与后续矩阵乘法操作匹配。
工作组分块适配：根据调整后的维度顺序，重新计算工作组分块策略，确保分块大小能够整除输出张量的各维度。
维度折叠策略优化：仅在所有滤波器维度均为单位维度时才进行折叠，避免部分折叠导致的维度混淆。

技术影响

这一问题的解决对于IREE项目的卷积运算处理具有重要意义：

提高了卷积运算转换为IGEMM的可靠性，特别是对于具有非单位滤波器维度的卷积。
为后续支持分组卷积等更复杂的卷积形式奠定了基础。
优化了共享内存使用，避免了因维度处理不当导致的内存溢出问题。

结论

通过本次问题的分析和解决，IREE项目在卷积运算处理方面得到了进一步优化。这不仅解决了当前的具体问题，也为未来处理更复杂的卷积模式提供了宝贵经验。开发团队将继续完善维度处理逻辑，确保在各种卷积配置下都能正确高效地转换为IGEMM形式。

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

Python

2.25 K

677