OpenBLAS在LoongArch64架构下与GCC14的兼容性问题分析

2025-06-01 06:20:58作者：冯梦姬Eddie

问题背景

OpenBLAS作为高性能线性代数计算库，在LoongArch64架构上的支持一直备受关注。近期开发者在LoongArch64平台上使用GCC14编译OpenBLAS时遇到了两个主要问题：编译参数识别错误和单元测试失败。

编译参数识别问题

在GCC14环境下，OpenBLAS构建系统会传递"-mabi=lp64"参数，但GCC14仅支持"lp64d"、"lp64f"和"lp64s"三种ABI规范。这个问题源于cpuid_loongarch64.c文件中缺少必要的头文件包含。

问题根源

cpuid_loongarch64.c文件中使用了printf函数，但未包含stdio.h头文件。这导致编译器无法正确识别printf函数声明，进而影响了ABI参数的检测逻辑。

解决方案

在cpuid_loongarch64.c文件中添加以下头文件包含即可解决：

#include <stdio.h>

单元测试失败问题

在GCC13.2及更高版本中，potrf测试用例会出现意外失败。具体表现为：

单精度测试(s)中，误差1.19209e-07超过了1e-5的阈值
双精度测试(d)中，误差4.44089e-16超过了1e-12的阈值

问题分析

这种现象极为反常，因为实际误差值明显小于测试设定的阈值。经过多环境测试发现：

使用GCC8.3.0(Loongnix定制版)测试通过
使用GCC13.2.0(官方版)出现单精度测试失败
使用GCC14.0.1出现双精度测试失败

可能原因

编译器优化问题：GCC新版本可能引入了更激进的浮点运算优化
ABI规范变化：不同GCC版本对LoongArch64浮点ABI的实现可能有差异
测试阈值设置：可能需要根据新编译器特性调整测试容错范围

技术建议

对于开发者而言，建议采取以下措施：

确保cpuid_loongarch64.c包含所有必要的头文件
针对GCC14+环境，可能需要调整测试用例的容错阈值
考虑在构建系统中增加对GCC版本的检测和特殊处理
向GCC社区反馈可能的浮点运算问题

总结

OpenBLAS在LoongArch64架构上的支持仍需完善，特别是在新版本GCC环境下。虽然可以通过简单修改解决编译问题，但浮点运算精度的差异需要更深入的调查。建议开发者在LoongArch64平台上使用经过验证的GCC版本进行构建，或等待官方对这些问题的进一步修复。

OpenBLAS

OpenBLAS is an optimized BLAS library based on GotoBLAS2 1.13 BSD version.

项目地址：https://gitcode.com/gh_mirrors/op/OpenBLAS

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

nop-entropy

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

349

200

pytorch

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理

OpenBLAS在LoongArch64架构下与GCC14的兼容性问题分析

问题背景

编译参数识别问题

问题根源

解决方案

单元测试失败问题

问题分析

可能原因

技术建议

总结

热门内容推荐

最新内容推荐

项目优选

OpenBLAS在LoongArch64架构下与GCC14的兼容性问题分析

问题背景

编译参数识别问题

问题根源

解决方案

单元测试失败问题

问题分析

可能原因

技术建议

总结

相关内容推荐

热门内容推荐

最新内容推荐

项目优选