OpenBLAS中ASMFLAGS设置导致非法指令问题的分析与解决

2025-06-02 21:26:48作者：郦嵘贵Just

问题背景

在OpenBLAS 0.3.26版本中，当用户启用了CET(Control-flow Enforcement Technology)支持并设置了ASMFLAGS参数后，某些处理器(如Zen 1)上会出现非法指令错误。这个问题最初在Arch Linux的打包过程中被发现，表现为在使用特定编译标志构建的OpenBLAS库在某些CPU上运行时触发SIGILL信号。

技术分析

CET技术简介

CET是Intel和AMD处理器上的一种安全特性，旨在防止面向返回编程(ROP)和面向跳转编程(JOP)攻击。它通过两种机制实现：

保护栈(Protected Stack)：为返回地址提供保护
间接分支跟踪(Indirect Branch Tracking)：确保间接跳转和调用指向有效位置

问题根源

经过深入分析，发现问题并非直接由CET支持(-fcf-protection)引起，而是与构建系统的CPU检测机制有关。当使用DYNAMIC_ARCH=ON选项时，OpenBLAS会为多种CPU架构生成优化代码，但构建过程本身需要确定一个基础架构。

关键发现点：

构建环境使用了AVX512支持的CPU(如EPYC 9454P)，但运行时环境可能是较旧的CPU(如Zen 1)
构建系统未能正确检测QEMU虚拟环境中的CPU特性，导致基础架构设置不当
使用CORE=CORE2参数实际上并未正确生效，需要改用TARGET参数

解决方案

正确的构建参数设置

对于需要支持多种CPU架构的场景，推荐使用以下构建参数：

FC=gfortran cmake -B build \
    -DCMAKE_INSTALL_PREFIX=/usr \
    -DBUILD_SHARED_LIBS=ON \
    -DBUILD_TESTING=OFF \
    -DNO_AFFINITY=ON \
    -DUSE_OPENMP=1 \
    -DNO_WARMUP=1 \
    -DTARGET=CORE2 \  # 使用TARGET而非CORE
    -DNUM_THREADS=64 \
    -DDYNAMIC_ARCH=ON

编译标志建议

对于需要安全加固但又需兼容旧硬件的场景，可以谨慎选择以下编译标志：

# 安全且兼容性较好的标志组合
export FCFLAGS="-march=x86-64 -mtune=generic -O2 -pipe -fno-plt -fexceptions"
export ASMFLAGS="-march=x86-64 -mtune=generic -O2 -pipe -fno-plt"