AX-LLM项目安装与配置指南

2025-04-17 23:36:35作者：柏廷章Berta

1. 项目基础介绍

AX-LLM 是由爱芯元智主导开发的开源项目，旨在探索大型语言模型（LLM）在AXera AI芯片平台上部署的可行性和性能边界。该项目的目标是帮助社区开发者快速评估和二次开发自己的LLM应用。已支持的芯片包括AX650A/AX650N和AX630C等。

主要编程语言：C++、Python、CMake

2. 关键技术和框架

AXera AI芯片平台：项目针对AXera系列AI芯片进行优化，包括AX650和AX630等型号。
LLM编译器：支持Pulsar2 llm build，默认w8a16量化，能从Huggingface仓库直接转换模型，并支持自定义prompt仿真运行。
模型库：包含Qwen、MiniCPM、Llama等多种流行的大模型，支持在边缘设备上进行推理。
量化技术：采用量化技术降低模型大小，提高运行效率。

3. 安装和配置

准备工作

在开始安装之前，请确保您的系统中已经安装了以下依赖：

Git
CMake
GCC (建议版本4.9或更高)
Python (建议版本3.6或更高)
pip

安装步骤

克隆项目

使用Git命令克隆项目到本地：
```
git clone --recursive https://github.com/AXERA-TECH/ax-llm.git
```
请确保使用--recursive参数以正确克隆所有子模块。
设置环境变量

根据您的系统环境，设置BSP_MSP_DIR环境变量以指向您的芯片支持包（BSP）目录。
```
export BSP_MSP_DIR=/path/to/your/bsp/dir
```
编译项目

进入项目目录，并运行编译脚本：
```
cd ax-llm
./build.sh
```
编译脚本会根据您的芯片平台和配置编译相应的程序。
验证安装

编译完成后，在build/install/bin目录下应该有如下文件：
```
install/bin/
├── main
├── run_bf16.sh
└── run_qwen_1.8B.sh
```
这意味着项目已经成功编译。

以上步骤为AX-LLM项目的详细安装和配置指南，按照上述步骤操作，即可完成项目的搭建。

登录后查看全文

最新内容推荐

Python开发者的macOS终极指南：VSCode安装配置全攻略基于Matlab的等几何分析IGA软件包：工程计算与几何建模的完美融合深入解析Windows内核模式驱动管理器：系统驱动管理的终极利器基恩士LJ-X8000A开发版SDK样本程序全面指南 - 工业激光轮廓仪开发利器咖啡豆识别数据集：AI目标检测在咖啡质量控制中的革命性应用 STM32到GD32项目移植完全指南：从兼容性到实战技巧瀚高迁移工具migration-4.1.4：企业级数据库迁移的智能解决方案昆仑通态MCGS与台达VFD-M变频器通讯程序详解：工业自动化控制完美解决方案 PADS元器件位号居中脚本：提升PCB设计效率的自动化利器 MQTT客户端软件源代码：物联网开发的强大工具与最佳实践指南

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

cangjie_compiler

仓颉编译器源码及 cjdb 调试工具。

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

flutter_flutter

ohos_react_native

React Native鸿蒙化仓库

cangjie_runtime

仓颉编程语言运行时与标准库。