OpenBLAS项目在Windows ARM平台上的原生编译指南

2025-06-01 09:26:00作者：邓越浪Henry

OpenBLAS is an optimized BLAS library based on GotoBLAS2 1.13 BSD version.

项目地址：https://gitcode.com/gh_mirrors/op/OpenBLAS

前言

OpenBLAS作为一款开源的高性能线性代数计算库，在科学计算和机器学习领域有着广泛应用。本文将详细介绍如何在Windows on ARM（WoA）平台上进行OpenBLAS的原生编译，帮助开发者在ARM64架构设备上构建完整的OpenBLAS库。

编译环境准备

在开始编译前，需要准备以下工具链：

LLVM工具链：推荐使用最新版本的LLVM工具链（19.1.2或更高），这是支持ARM64架构的关键编译工具
Visual Studio 2022：社区版即可，需安装"Desktop development with C++"工作负载
CMake：3.20或更高版本，用于构建系统生成
Ninja：高效的构建工具，可显著加快编译速度

详细编译步骤

1. 获取源代码

首先从OpenBLAS官方仓库获取源代码并切换到稳定版本分支：

git clone https://github.com/OpenMathLib/OpenBLAS.git
cd OpenBLAS
git checkout v0.3.28

2. 设置编译环境

必须使用ARM64原生工具命令提示符来确保正确的编译环境：

从开始菜单搜索并启动"ARM64 Native Tools Command Prompt for Visual Studio 2022"

或者手动运行环境设置脚本：

"C:\Program Files\Microsoft Visual Studio\2022\Community\VC\Auxiliary\Build\vcvarsarm64.bat"

3. 配置构建系统

创建构建目录并配置CMake：

mkdir build
cd build
cmake .. -G Ninja -DCMAKE_BUILD_TYPE=Release \
         -DTARGET=ARMV8 -DBINARY=64 \
         -DCMAKE_C_COMPILER=clang-cl \
         -DCMAKE_C_COMPILER_TARGET=arm64-pc-windows-msvc \
         -DCMAKE_ASM_COMPILER_TARGET=arm64-pc-windows-msvc \
         -DCMAKE_Fortran_COMPILER=flang-new

关键参数说明：

-G Ninja：指定使用Ninja作为构建系统
-DTARGET=ARMV8：明确指定ARMv8架构
-DCMAKE_Fortran_COMPILER=flang-new：使用LLVM的Flang编译器构建LAPACK功能

4. 构建选项定制

根据需求可添加以下构建选项：

-DBUILD_SHARED_LIBS=ON：生成动态链接库(DLL)
-DNO_LAPACK=1：如果不需要LAPACK功能可禁用
-DNO_FORTRAN=1：如果不需要Fortran接口可禁用

5. 执行编译

使用Ninja进行并行编译（根据CPU核心数调整-j参数）：

ninja -j16

测试验证

编译完成后，建议运行测试套件验证功能完整性：

ctest

注意：如果构建的是动态库版本，需要将生成的DLL路径添加到系统PATH环境变量中，否则测试程序可能无法正常运行。

常见问题解决

编译器冲突：确保LLVM工具链路径在系统PATH环境变量中位于最前面，避免与其他编译器冲突
Fortran支持：如需完整的LAPACK功能，必须安装并正确配置Flang编译器
构建失败：检查是否使用了正确的ARM64原生命令提示符，普通命令提示符可能导致构建错误

性能优化建议

针对特定ARM处理器型号，可调整-DTARGET参数以获得最佳性能
启用架构特定优化标志，如NEON指令集支持
对于生产环境，建议使用-DCMAKE_BUILD_TYPE=Release以获得最优性能

结语

通过本文介绍的方法，开发者可以在Windows ARM设备上成功构建高性能的OpenBLAS库。相比x86平台，ARM架构上的构建过程需要特别注意工具链的选择和环境配置。正确配置后，OpenBLAS可以在WoA平台上发挥出优秀的计算性能，为ARM生态的科学计算应用提供有力支持。

OpenBLAS is an optimized BLAS library based on GotoBLAS2 1.13 BSD version.

项目地址：https://gitcode.com/gh_mirrors/op/OpenBLAS

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

昇腾LLM分布式训练框架

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

flutter_flutter

ohos_react_native

React Native鸿蒙化仓库

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力