首页
/ OpenBLAS项目在RISC-V架构下的编译问题分析与解决

OpenBLAS项目在RISC-V架构下的编译问题分析与解决

2025-06-01 09:53:46作者:滑思眉Philip

问题背景

在RISC-V架构的Milk-V(M1) Jupiter开发板上使用Arch Linux系统编译OpenBLAS 0.3.29版本时,遇到了关于strmm_kernel_RN和strmm_kernel_LN函数类型冲突的编译错误。这个问题特别出现在使用RISCV64_ZVL256B和RISCV64_ZVL128B目标架构时。

技术细节分析

编译错误的核心在于函数声明不匹配。错误信息显示:

  1. 在sgemm_kernel_16x8_zvl256b.c文件中定义的strmm_kernel_RN函数签名是: int(BLASLONG, BLASLONG, BLASLONG, float, float*, float*, float*, BLASLONG)

  2. 而在common_level3.h头文件中的声明却是: int(BLASLONG, BLASLONG, BLASLONG, float, float*, float*, float*, BLASLONG, BLASLONG)

两者参数数量不一致,导致类型冲突。类似的问题也出现在strmm_kernel_LN函数上。

根本原因

经过深入分析,发现这是由于CMake构建系统中缺少关键定义导致的。在传统的Makefile构建方式中,Makefile.L3文件会为RISC-V目标定义USE_TRMM宏,这个宏会指示构建系统使用专门的TRMM内核源文件,而不是默认的GEMM内核源文件。

然而在CMake构建系统中,kernel/CMakeLists.txt文件没有为RISCV64目标架构定义USE_TRMM宏,导致系统错误地尝试使用GEMM内核来实现TRMM操作,从而引发了函数签名不匹配的问题。

解决方案

要解决这个问题,需要修改CMake构建配置,确保为RISC-V目标架构正确定义USE_TRMM宏。具体来说,应该在kernel/CMakeLists.txt文件中添加相应的条件判断和宏定义,使其行为与Makefile.L3保持一致。

对于开发者而言,临时解决方案可以尝试手动在构建命令中添加-DUSE_TRMM定义,或者直接修改CMakeLists.txt文件,在RISCV64架构检测部分加入相应的宏定义。

技术影响

这个问题不仅影响使用ZVL256B和ZVL128B向量扩展的RISC-V系统,实际上可能影响所有使用CMake构建的RISC-V平台上的OpenBLAS编译。TRMM(三角矩阵乘法)是BLAS Level 3中的重要操作,这个问题会导致相关功能无法正常编译,影响矩阵计算性能。

预防措施

对于开源项目维护者来说,这个案例提醒我们:

  1. 当添加对新架构支持时,需要确保所有构建系统的一致性
  2. CMake和Makefile构建路径应该保持功能对等
  3. 新增架构支持时需要进行全面的构建测试

对于用户来说,在RISC-V平台上编译数学库时应当:

  1. 关注编译日志中的警告信息
  2. 了解不同构建系统的差异
  3. 遇到类似问题时可以尝试比较不同构建系统的配置差异

总结

这个问题展示了在移植大型数学库到新兴架构时可能遇到的挑战。RISC-V作为一种模块化架构,其多样的扩展组合给软件兼容性带来了额外的复杂性。OpenBLAS作为高性能线性代数库,其多架构支持需要精心维护。通过这个案例,我们可以看到构建系统配置对软件可移植性的关键影响,也为未来类似问题的解决提供了参考思路。

登录后查看全文
热门项目推荐

热门内容推荐

最新内容推荐

项目优选

收起
ohos_react_nativeohos_react_native
React Native鸿蒙化仓库
C++
177
262
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
864
512
ShopXO开源商城ShopXO开源商城
🔥🔥🔥ShopXO企业级免费开源商城系统,可视化DIY拖拽装修、包含PC、H5、多端小程序(微信+支付宝+百度+头条&抖音+QQ+快手)、APP、多仓库、多商户、多门店、IM客服、进销存,遵循MIT开源协议发布、基于ThinkPHP8框架研发
JavaScript
93
15
openGauss-serveropenGauss-server
openGauss kernel ~ openGauss is an open source relational database management system
C++
129
182
openHiTLSopenHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
261
302
kernelkernel
deepin linux kernel
C
22
5
cherry-studiocherry-studio
🍒 Cherry Studio 是一款支持多个 LLM 提供商的桌面客户端
TypeScript
596
57
CangjieCommunityCangjieCommunity
为仓颉编程语言开发者打造活跃、开放、高质量的社区环境
Markdown
1.07 K
0
HarmonyOS-ExamplesHarmonyOS-Examples
本仓将收集和展示仓颉鸿蒙应用示例代码,欢迎大家投稿,在仓颉鸿蒙社区展现你的妙趣设计!
Cangjie
398
371
Cangjie-ExamplesCangjie-Examples
本仓将收集和展示高质量的仓颉示例代码,欢迎大家投稿,让全世界看到您的妙趣设计,也让更多人通过您的编码理解和喜爱仓颉语言。
Cangjie
332
1.08 K