OpenBLAS 技术文档
2024-12-18 16:14:19作者:舒璇辛Bertina
1. 安装指南
1.1 依赖项
在安装 OpenBLAS 之前,请确保系统中已安装以下依赖项:
- GNU Make
- C 编译器(如 GCC 或 Clang)
- Fortran 编译器(可选,用于 LAPACK)
- IBM MASS(可选,仅在 Power CPU 上使用)
1.2 从源码安装
-
下载源码:
- 从项目主页下载:OpenBLAS 主页
- 或使用 Git 克隆代码:
git clone https://github.com/xianyi/OpenBLAS.git
-
进入 OpenBLAS 目录:
cd OpenBLAS
-
编译:
- 默认编译(自动检测 CPU):
make
- 指定目标 CPU:
make TARGET=NEHALEM
- 交叉编译:
make BINARY=64 CC=mips64el-unknown-linux-gnu-gcc FC=mips64el-unknown-linux-gnu-gfortran HOSTCC=gcc TARGET=LOONGSON3A
- 默认编译(自动检测 CPU):
-
安装:
make install
默认安装目录为
/opt/OpenBLAS
,可以通过PREFIX=
指定安装目录:make install PREFIX=/your/custom/path
1.3 使用 MASS 支持(仅限 Power CPU)
-
安装 IBM MASS 库:
- 在 Ubuntu 上:
sudo apt-get install libxlmass-devel.8.1.5
- 在 RHEL/CentOS 上:
sudo yum install libxlmass-devel.8.1.5
- 在 Ubuntu 上:
-
编译 OpenBLAS 并启用 MASS 支持:
make USE_MASS=1 TARGET=POWER8
2. 项目使用说明
2.1 简介
OpenBLAS 是一个基于 GotoBLAS2 1.13 BSD 版本的优化 BLAS(基本线性代数子程序)库。它提供了高效的线性代数运算,适用于多种 CPU 架构。
2.2 支持的 CPU 和操作系统
OpenBLAS 支持多种 CPU 架构,包括 x86/x86-64、MIPS、ARM、ARM64、PPC/PPC64 和 IBM zEnterprise 系统。具体支持的 CPU 型号请参考 GotoBLAS_01Readme.txt
。
2.3 使用场景
OpenBLAS 主要用于科学计算、数据分析和机器学习等领域,提供高效的矩阵运算和向量运算。
3. 项目 API 使用文档
3.1 BLAS 接口
OpenBLAS 实现了标准的 BLAS 接口,包括以下主要功能:
- Level 1:向量运算(如点积、向量加法)
- Level 2:矩阵-向量运算(如矩阵乘向量)
- Level 3:矩阵-矩阵运算(如矩阵乘法)
3.2 LAPACK 接口
OpenBLAS 还包含了 LAPACK 库,提供了更高层次的线性代数运算,如矩阵分解、求解线性方程组等。
3.3 示例代码
以下是一个简单的矩阵乘法示例:
#include <cblas.h>
int main() {
double A[2][3] = { {1.0, 2.0, 3.0}, {4.0, 5.0, 6.0} };
double B[3][2] = { {7.0, 8.0}, {9.0, 10.0}, {11.0, 12.0} };
double C[2][2] = { {0.0, 0.0}, {0.0, 0.0} };
cblas_dgemm(CblasRowMajor, CblasNoTrans, CblasNoTrans, 2, 2, 3, 1.0, &A[0][0], 3, &B[0][0], 2, 0.0, &C[0][0], 2);
return 0;
}
4. 项目安装方式
4.1 从源码安装
如前所述,通过 make
命令编译并安装 OpenBLAS。
4.2 使用预编译二进制包
OpenBLAS 提供了官方的二进制包,适用于 Windows x86/x86_64 平台。可以从 SourceForge 或 GitHub Releases 页面下载。
4.3 使用包管理器安装
在某些操作系统上,可以通过包管理器直接安装 OpenBLAS,例如:
- Ubuntu:
sudo apt-get install libopenblas-dev
- CentOS/RHEL:
sudo yum install openblas-devel
通过以上步骤,您可以顺利安装并使用 OpenBLAS 进行高效的线性代数运算。
热门项目推荐
鸿蒙开发工具大赶集
本仓将收集和展示鸿蒙开发工具,欢迎大家踊跃投稿。通过pr附上您的工具介绍和使用指南,并加上工具对应的链接,通过的工具将会成功上架到我们社区。014FlashMLA
FlashMLA是DeepSeek在2025年2月24日启动的“开源周”中发布的首个核心技术项目。 主要针对 Hopper GPU 的高效 MLA 解码内核,优化了可变长度序列服务。支持 BF16 和特定块大小分页 kvcache。源项目地址:https://github.com/deepseek-ai/FlashMLAC++00每日精选项目
🔥🔥 每日精选已经升级为:【行业动态】,快去首页看看吧,后续都在【首页 - 行业动态】内更新,多条更新哦~🔥🔥 每日推荐行业内最新、增长最快的项目,快速了解行业最新热门项目动态~~030BootstrapAdmin
基于 RBAC 的 Net8 后台管理框架,权限管理,前后台分离,支持多站点单点登录,兼容所有主流浏览器,内置微信、支付宝、QQ等多种登录方式,内置多种样式,可切换至 Blazor 多 Tabs 模式,权限控制细化到网页内任意元素(按钮、表格、文本框等等)C#00Cangjie-Examples
本仓将收集和展示高质量的仓颉示例代码,欢迎大家投稿,让全世界看到您的妙趣设计,也让更多人通过您的编码理解和喜爱仓颉语言。Cangjie061毕方Talon工具
本工具是一个端到端的工具,用于项目的生成IR并自动进行缺陷检测。Python040PDFMathTranslate
PDF scientific paper translation with preserved formats - 基于 AI 完整保留排版的 PDF 文档全文双语翻译,支持 Google/DeepL/Ollama/OpenAI 等服务,提供 CLI/GUI/DockerPython06mybatis-plus
mybatis 增强工具包,简化 CRUD 操作。 文档 http://baomidou.com 低代码组件库 http://aizuda.comJava03国产编程语言蓝皮书
《国产编程语言蓝皮书》-编委会工作区018- DDeepSeek-R1探索新一代推理模型,DeepSeek-R1系列以大规模强化学习为基础,实现自主推理,表现卓越,推理行为强大且独特。开源共享,助力研究社区深入探索LLM推理能力,推动行业发展。【此简介由AI生成】。Python00
热门内容推荐
最新内容推荐
项目优选
收起

Python - 100天从新手到大师
Python
643
120

React Native鸿蒙化仓库
C++
9
19

方舟分析器:面向ArkTS语言的静态程序分析框架
TypeScript
6
10

open-eBackup是一款开源备份软件,采用集群高扩展架构,通过应用备份通用框架、并行备份等技术,为主流数据库、虚拟化、文件系统、大数据等应用提供E2E的数据备份、恢复等能力,帮助用户实现关键数据高效保护。
HTML
90
65

本仓将收集和展示高质量的仓颉示例代码,欢迎大家投稿,让全世界看到您的妙趣设计,也让更多人通过您的编码理解和喜爱仓颉语言。
Cangjie
205
61

🎉 基于Spring Boot、Spring Cloud & Alibaba、Vue3 & Vite、Element Plus的分布式前后端分离微服务架构权限管理系统
Vue
45
31

本仓将收集和展示仓颉鸿蒙应用示例代码,欢迎大家投稿,在仓颉鸿蒙社区展现你的妙趣设计!
Cangjie
287
82

为仓颉编程语言开发者打造活跃、开放、高质量的社区环境
Markdown
901
0

🎉 基于SpringBoot,Spring Security,JWT,Vue & Element 的前后端分离权限管理系统,同时提供了 Vue3 的版本
Java
182
44

旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
60
49