首页
/ OpenBLAS在macOS x64架构下的编译与测试问题分析

OpenBLAS在macOS x64架构下的编译与测试问题分析

2025-06-01 09:41:38作者:吴年前Myrtle

问题背景

在macOS系统上使用flang-new编译器为x64架构构建OpenBLAS时,开发者遇到了测试阶段cblat1程序出现段错误(Segmentation fault)的问题。该问题不仅出现在flang-new编译环境下,在使用gfortran编译器时同样存在,且与编译优化级别和链接方式密切相关。

问题现象

当使用以下命令构建OpenBLAS时:

arch -x86_64 make FC=/path/to/flang-new "FCOMMON_OPT=-Wl,-syslibroot /path/to/MacOSX.sdk" NO_SHARED=1 TARGET=NEHALEM "CFLAGS=-arch x86_64" -j8

测试程序cblat1会在执行过程中崩溃,LLDB调试器显示错误发生在cdotc_函数中,具体是尝试访问非法内存地址0x30。

深入分析

编译器识别问题

最初发现OpenBLAS的Makefile将flang-new错误识别为"经典flang"(classic flang),导致使用了错误的ABI假设。修正Makefile.conf中的F_COMPILER设置从FLANG改为FLANGNEW后,cblat1测试通过,但出现了更早的测试失败。

优化级别影响

测试表明,构建类型对测试结果有显著影响:

  • Debug构建(使用-O0优化级别):测试通过
  • Release/RelWithDebInfo构建(使用-O3/-O2优化级别):测试失败

这表明Apple Clang编译器在高优化级别下可能对utest/test_min.c文件产生了错误的代码优化。

静态链接问题

另一个关键发现是问题仅出现在静态链接构建中:

  • BUILD_STATIC_LIBS=ON:测试失败
  • BUILD_STATIC_LIBS=OFF(动态链接):测试通过

解决方案与建议

  1. 编译器识别:确保Makefile正确识别flang-new编译器,设置F_COMPILER为FLANGNEW而非FLANG。

  2. 优化级别调整:对于出现问题的测试文件,可以尝试:

    • 在文件顶部添加#pragma clang optimize off禁用优化
    • 或针对特定目标降低优化级别:target_compile_options(${OpenBLAS_utest_bin} PUBLIC -O0)
  3. 链接方式选择:如果项目允许,优先考虑使用动态链接方式构建,这可以规避当前静态链接下出现的问题。

  4. 编译器版本:考虑使用与flang-new配套的LLVM clang版本,而非系统自带的Apple Clang,以确保工具链的一致性。

技术要点总结

  1. 不同Fortran编译器(flang-new vs gfortran)在macOS x64架构下都表现出相似的问题,说明问题可能与平台特性相关。

  2. 优化级别导致的测试失败暗示着编译器在高优化级别下可能存在代码生成或优化缺陷。

  3. 静态/动态链接的行为差异表明问题可能涉及链接时的符号解析或内存布局。

  4. 系统库路径设置(-syslibroot)对构建成功至关重要,特别是在跨架构编译时。

这个问题展示了在macOS上进行跨架构(x86_64)构建时的典型挑战,特别是在使用非Apple官方工具链时。开发者需要特别注意编译器识别、优化级别设置和链接方式选择等因素,才能确保OpenBLAS的正确构建和测试通过。

登录后查看全文
热门项目推荐

热门内容推荐

最新内容推荐

项目优选

收起
ohos_react_nativeohos_react_native
React Native鸿蒙化仓库
C++
176
261
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
858
511
openGauss-serveropenGauss-server
openGauss kernel ~ openGauss is an open source relational database management system
C++
129
182
openHiTLSopenHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
258
298
ShopXO开源商城ShopXO开源商城
🔥🔥🔥ShopXO企业级免费开源商城系统,可视化DIY拖拽装修、包含PC、H5、多端小程序(微信+支付宝+百度+头条&抖音+QQ+快手)、APP、多仓库、多商户、多门店、IM客服、进销存,遵循MIT开源协议发布、基于ThinkPHP8框架研发
JavaScript
93
15
Cangjie-ExamplesCangjie-Examples
本仓将收集和展示高质量的仓颉示例代码,欢迎大家投稿,让全世界看到您的妙趣设计,也让更多人通过您的编码理解和喜爱仓颉语言。
Cangjie
332
1.08 K
HarmonyOS-ExamplesHarmonyOS-Examples
本仓将收集和展示仓颉鸿蒙应用示例代码,欢迎大家投稿,在仓颉鸿蒙社区展现你的妙趣设计!
Cangjie
398
371
note-gennote-gen
一款跨平台的 Markdown AI 笔记软件,致力于使用 AI 建立记录和写作的桥梁。
TSX
83
4
CangjieCommunityCangjieCommunity
为仓颉编程语言开发者打造活跃、开放、高质量的社区环境
Markdown
1.07 K
0
kernelkernel
deepin linux kernel
C
22
5