IREE项目中RISC-V 64架构动态打包操作的数值问题分析与解决

2025-06-26 00:02:51作者：龚格成

在IREE编译器项目中，开发团队发现了一个关于RISC-V 64架构下动态打包操作（dynamic pack）的数值精度问题。这个问题最初在代码审查过程中被发现，表现为动态打包操作在RISC-V 64平台上运行时产生了与预期不符的数值结果。

问题现象

测试用例显示，RISC-V 64架构在执行动态打包操作时，输出张量的数值与预期结果存在明显差异。具体表现为：

静态打包测试（static_pack_simple_pad_mode）中，实际输出与预期输出在多个位置存在数值差异
动态打包测试（dynamic_pack_simple_pad_mode）中，同样出现了数值不匹配的情况

测试用例原本设计用于验证打包操作在不同填充模式下的正确性，但在RISC-V 64平台上却未能通过验证。

技术背景

打包操作（pack operation）是深度学习编译器中的一个重要功能，它负责将输入张量按照特定模式重新排列和填充。在IREE中，这个操作被广泛用于数据布局转换和内存优化。动态打包与静态打包的主要区别在于，动态打包的某些参数（如填充大小）可以在运行时确定，而静态打包的所有参数都必须在编译时确定。

RISC-V作为一种新兴的开源指令集架构，其64位版本在数值处理上可能存在一些特殊行为，特别是在处理动态形状和填充操作时。

问题根源

经过深入分析，开发团队发现这个问题源于LLVM后端对RISC-V 64架构的代码生成存在缺陷。具体来说，在处理动态打包操作时，某些边界条件的处理不够完善，导致了数值计算错误。

解决方案

开发团队在LLVM项目中提交了修复补丁，该补丁专门针对RISC-V 64架构下的打包操作进行了优化。修复主要包括：

修正了边界条件处理的逻辑
优化了动态形状计算时的数值精度保证
完善了填充模式下的特殊处理

这个修复已经合并到LLVM主分支，并经过验证能够正确解决IREE测试用例中的数值问题。

后续工作

随着LLVM修复补丁的合入，IREE团队计划：

在下次LLVM同步时将修复引入IREE代码库
重新启用之前因这个问题而禁用的RISC-V 64测试用例
加强对RISC-V架构下数值操作的测试覆盖

这个问题的解决不仅修复了当前的测试失败，也为IREE在RISC-V架构上的进一步优化和功能开发奠定了基础。随着RISC-V生态的不断发展，IREE团队将持续关注并优化其在该架构上的表现。

iree

A retargetable MLIR-based machine learning compiler and runtime toolkit.

项目地址：https://gitcode.com/gh_mirrors/ir/iree

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

TSX

1.13 K

271

IREE项目中RISC-V 64架构动态打包操作的数值问题分析与解决

问题现象

技术背景

问题根源

解决方案

后续工作

热门内容推荐

最新内容推荐

项目优选

IREE项目中RISC-V 64架构动态打包操作的数值问题分析与解决

问题现象

技术背景

问题根源

解决方案

后续工作

相关内容推荐

热门内容推荐

最新内容推荐

项目优选