Qwen.cpp 项目下载及安装教程

2024-12-09 04:22:14作者：戚魁泉Nursing

1. 项目介绍

Qwen.cpp 是一个基于 C++ 实现的 Qwen-LM 模型，旨在为 MacBook 提供实时聊天功能。该项目的主要特点包括：

纯 C++ 实现，基于 ggml，与 llama.cpp 工作方式相同。
纯 C++ 实现的 tiktoken。
支持流式生成，带有打字机效果。
提供 Python 绑定。

2. 项目下载位置

要下载 Qwen.cpp 项目，请执行以下命令：

git clone --recursive https://github.com/QwenLM/qwen.cpp.git
cd qwen.cpp

如果忘记添加 --recursive 标志，可以在项目目录下运行以下命令：

git submodule update --init --recursive

3. 项目安装环境配置

3.1 环境要求

硬件：x86/arm CPU、NVIDIA GPU
平台：Linux、MacOS

3.2 环境配置示例

以下是 MacOS 环境配置的示例：

MacOS 环境配置示例

4. 项目安装方式

4.1 编译项目

使用 CMake 编译项目：

cmake -B build
cmake --build build -j --config Release

4.2 运行模型

编译完成后，可以通过以下命令运行量化后的 Qwen-7B-Chat 模型：

./build/bin/main -m qwen7b-ggml.bin --tiktoken Qwen-7B-Chat/qwen.tiktoken -p 你好

如果需要以交互模式运行，可以添加 -i 标志：

./build/bin/main -m qwen7b-ggml.bin --tiktoken Qwen-7B-Chat/qwen.tiktoken -i

5. 项目处理脚本

5.1 量化模型

使用 convert.py 脚本将 Qwen-LM 模型转换为量化 GGML 格式：

python3 qwen_cpp/convert.py -i Qwen/Qwen-7B-Chat -t q4_0 -o qwen7b-ggml.bin

5.2 Python 绑定

安装 Python 绑定：

pip install -U qwen-cpp

使用示例：

import tiktoken_cpp as tiktoken
enc = tiktoken.get_encoding("cl100k_base")
assert enc.decode(enc.encode("hello world")) == "hello world"

通过以上步骤，您可以成功下载、安装并运行 Qwen.cpp 项目。

qwen.cpp

C++ implementation of Qwen-LM

项目地址：https://gitcode.com/gh_mirrors/qw/qwen.cpp

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

leetcode

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.37 K

781

Qwen.cpp 项目下载及安装教程

1. 项目介绍

2. 项目下载位置

3. 项目安装环境配置

3.1 环境要求

3.2 环境配置示例

4. 项目安装方式

4.1 编译项目

4.2 运行模型

5. 项目处理脚本

5.1 量化模型

5.2 Python 绑定

热门内容推荐

最新内容推荐

项目优选

Qwen.cpp 项目下载及安装教程

1. 项目介绍

2. 项目下载位置

3. 项目安装环境配置

3.1 环境要求

3.2 环境配置示例

4. 项目安装方式

4.1 编译项目

4.2 运行模型

5. 项目处理脚本

5.1 量化模型

5.2 Python 绑定

相关内容推荐

热门内容推荐

最新内容推荐

项目优选