OpenBLAS在RISC-V架构下的编译类型冲突问题解析
问题背景
在RISC-V架构下编译OpenBLAS时,特别是针对支持向量长度扩展(Zvl256b和Zvl128b)的目标平台,开发者可能会遇到函数类型冲突的编译错误。这类错误通常表现为strmm_kernel_RN和strmm_kernel_LN函数的声明与实现之间存在参数数量不匹配的问题。
错误现象分析
编译过程中出现的错误信息显示,在kernel模块中定义的矩阵乘法核函数与common_level3.h头文件中的函数声明存在类型冲突。具体表现为:
- 实现部分(sgemm_kernel_*.c文件)定义的函数接收8个参数
- 头文件(common_level3.h)中的声明却要求9个参数
这种不一致性导致编译器无法正确链接函数实现,最终导致编译失败。错误不仅出现在ZVL256B目标上,同样也影响ZVL128B目标的编译。
根本原因
经过技术分析,这个问题源于CMake构建系统的一个配置缺陷。在传统的Makefile构建系统(Makefile.L3)中,会为RISC-V64目标明确定义USE_TRMM宏,这个宏的作用是指示构建系统使用专门的TRMM(三角矩阵乘法)内核源代码,而不是通用的GEMM(通用矩阵乘法)实现。
然而在CMake构建系统(kernel/CMakeLists.txt)中,这一关键配置被遗漏了,导致:
- 构建系统错误地尝试使用GEMM内核来实现TRMM操作
- 函数参数数量不匹配
- 最终引发类型冲突的编译错误
解决方案
要解决这个问题,需要在CMake构建系统中为RISC-V64目标添加正确的USE_TRMM宏定义。具体可以通过以下方式实现:
- 修改kernel/CMakeLists.txt文件
- 为RISCV64目标添加相应的编译定义
- 确保与Makefile.L3中的配置保持一致
这种修改将确保构建系统选择正确的内核实现,避免函数声明与实现之间的参数不匹配问题。
技术影响
这个问题特别影响那些使用较新RISC-V向量扩展指令集的平台,如SpacemiT K1/M1处理器。由于这些平台依赖特定的向量长度扩展(Zvl256b/Zvl128b)来获得最佳性能,编译失败会直接影响在这些硬件上的科学计算性能。
开发者建议
对于遇到此类问题的开发者,建议:
- 检查使用的OpenBLAS版本是否包含相关修复
- 临时解决方案可以尝试手动添加USE_TRMM定义
- 关注项目更新,确保获取最新的构建系统修复
这个问题凸显了在不同构建系统间保持配置一致性的重要性,特别是在支持新兴硬件架构时。随着RISC-V生态的发展,这类问题有望在未来的版本中得到更系统的解决。
Kimi-K2.5Kimi K2.5 是一款开源的原生多模态智能体模型,它在 Kimi-K2-Base 的基础上,通过对约 15 万亿混合视觉和文本 tokens 进行持续预训练构建而成。该模型将视觉与语言理解、高级智能体能力、即时模式与思考模式,以及对话式与智能体范式无缝融合。Python00- QQwen3-Coder-Next2026年2月4日,正式发布的Qwen3-Coder-Next,一款专为编码智能体和本地开发场景设计的开源语言模型。Python00
xw-cli实现国产算力大模型零门槛部署,一键跑通 Qwen、GLM-4.7、Minimax-2.1、DeepSeek-OCR 等模型Go06
PaddleOCR-VL-1.5PaddleOCR-VL-1.5 是 PaddleOCR-VL 的新一代进阶模型,在 OmniDocBench v1.5 上实现了 94.5% 的全新 state-of-the-art 准确率。 为了严格评估模型在真实物理畸变下的鲁棒性——包括扫描伪影、倾斜、扭曲、屏幕拍摄和光照变化——我们提出了 Real5-OmniDocBench 基准测试集。实验结果表明,该增强模型在新构建的基准测试集上达到了 SOTA 性能。此外,我们通过整合印章识别和文本检测识别(text spotting)任务扩展了模型的能力,同时保持 0.9B 的超紧凑 VLM 规模,具备高效率特性。Python00
KuiklyUI基于KMP技术的高性能、全平台开发框架,具备统一代码库、极致易用性和动态灵活性。 Provide a high-performance, full-platform development framework with unified codebase, ultimate ease of use, and dynamic flexibility. 注意:本仓库为Github仓库镜像,PR或Issue请移步至Github发起,感谢支持!Kotlin08
VLOOKVLOOK™ 是优雅好用的 Typora/Markdown 主题包和增强插件。 VLOOK™ is an elegant and practical THEME PACKAGE × ENHANCEMENT PLUGIN for Typora/Markdown.Less00