OpenBLAS 技术文档

2024-12-18 16:14:19作者：舒璇辛Bertina

1. 安装指南

1.1 依赖项

在安装 OpenBLAS 之前，请确保系统中已安装以下依赖项：

GNU Make
C 编译器（如 GCC 或 Clang）
Fortran 编译器（可选，用于 LAPACK）
IBM MASS（可选，仅在 Power CPU 上使用）

1.2 从源码安装

下载源码：
- 从项目主页下载：OpenBLAS 主页
- 或使用 Git 克隆代码：
```
git clone https://github.com/xianyi/OpenBLAS.git
```
进入 OpenBLAS 目录：
```
cd OpenBLAS
```

编译：

默认编译（自动检测 CPU）：
```
make
```
指定目标 CPU：
```
make TARGET=NEHALEM
```

交叉编译：

make BINARY=64 CC=mips64el-unknown-linux-gnu-gcc FC=mips64el-unknown-linux-gnu-gfortran HOSTCC=gcc TARGET=LOONGSON3A

安装：
```
make install
```
默认安装目录为 /opt/OpenBLAS，可以通过 PREFIX= 指定安装目录：
```
make install PREFIX=/your/custom/path
```

1.3 使用 MASS 支持（仅限 Power CPU）

安装 IBM MASS 库：

在 Ubuntu 上：

sudo apt-get install libxlmass-devel.8.1.5

在 RHEL/CentOS 上：
```
sudo yum install libxlmass-devel.8.1.5
```

编译 OpenBLAS 并启用 MASS 支持：
```
make USE_MASS=1 TARGET=POWER8
```

2. 项目使用说明

2.1 简介

OpenBLAS 是一个基于 GotoBLAS2 1.13 BSD 版本的优化 BLAS（基本线性代数子程序）库。它提供了高效的线性代数运算，适用于多种 CPU 架构。

2.2 支持的 CPU 和操作系统

OpenBLAS 支持多种 CPU 架构，包括 x86/x86-64、MIPS、ARM、ARM64、PPC/PPC64 和 IBM zEnterprise 系统。具体支持的 CPU 型号请参考 GotoBLAS_01Readme.txt。

2.3 使用场景

OpenBLAS 主要用于科学计算、数据分析和机器学习等领域，提供高效的矩阵运算和向量运算。

3. 项目 API 使用文档

3.1 BLAS 接口

OpenBLAS 实现了标准的 BLAS 接口，包括以下主要功能：

Level 1：向量运算（如点积、向量加法）
Level 2：矩阵-向量运算（如矩阵乘向量）
Level 3：矩阵-矩阵运算（如矩阵乘法）

3.2 LAPACK 接口

OpenBLAS 还包含了 LAPACK 库，提供了更高层次的线性代数运算，如矩阵分解、求解线性方程组等。

3.3 示例代码

以下是一个简单的矩阵乘法示例：

#include <cblas.h>

int main() {
    double A[2][3] = { {1.0, 2.0, 3.0}, {4.0, 5.0, 6.0} };
    double B[3][2] = { {7.0, 8.0}, {9.0, 10.0}, {11.0, 12.0} };
    double C[2][2] = { {0.0, 0.0}, {0.0, 0.0} };

    cblas_dgemm(CblasRowMajor, CblasNoTrans, CblasNoTrans, 2, 2, 3, 1.0, &A[0][0], 3, &B[0][0], 2, 0.0, &C[0][0], 2);

    return 0;
}