TinyChatEngine 项目下载及安装教程

2024-12-09 05:25:36作者：幸俭卉

1. 项目介绍

TinyChatEngine 是一个用于在边缘设备上运行大型语言模型（LLM）和视觉语言模型（VLM）的推理库。它通过模型压缩技术（如 SmoothQuant 和 AWQ）实现了低精度的模型推理，使得用户可以在笔记本电脑、汽车、机器人等设备上获得即时响应，同时保护数据隐私。

2. 项目下载位置

要下载 TinyChatEngine 项目，请使用以下命令：

git clone --recursive https://github.com/mit-han-lab/TinyChatEngine.git

3. 项目安装环境配置

3.1 MacOS 环境配置

在 MacOS 上，您需要安装 boost 和 llvm 库。可以使用 Homebrew 进行安装：

brew install boost
brew install llvm

对于 M1/M2 用户，还需要从 App Store 安装 Xcode，以启用 Metal 编译器支持 GPU。

3.2 Windows 环境配置

3.2.1 Windows with CPU

在 Windows 上，您需要下载并安装 GCC 编译器和 MSYS2。请按照以下步骤操作：

下载并安装 MSYS2：MSYS2 安装教程
安装所需的依赖项：

pacman -S --needed base-devel mingw-w64-x86_64-toolchain make unzip git

将二进制目录（例如 C:\msys64\mingw64\bin 和 C:\msys64\usr\bin）添加到环境路径中。

3.2.2 Windows with Nvidia GPU (实验性)

安装 CUDA 工具包：CUDA 安装教程
安装 Visual Studio，并确保支持 C 和 C++ 开发。

4. 项目安装方式

4.1 下载项目

使用以下命令下载项目：

git clone --recursive https://github.com/mit-han-lab/TinyChatEngine.git
cd TinyChatEngine

4.2 安装 Python 包

TinyChatEngine 的主要代码库是用纯 C/C++ 编写的，Python 包仅用于从模型库中下载（和转换）模型。

conda create -n TinyChatEngine python=3.10 pip -y
conda activate TinyChatEngine
pip install -r requirements.txt

4.3 下载量化模型

根据您的设备类型，下载相应的量化模型：

4.3.1 x86 设备

cd llm
python tools/download_model.py --model LLaMA_3_8B_Instruct_awq_int4 --QM QM_x86

4.3.2 ARM 设备

cd llm
python tools/download_model.py --model LLaMA_3_8B_Instruct_awq_int4 --QM QM_ARM

4.3.3 CUDA 设备

cd llm
python tools/download_model.py --model LLaMA2_7B_chat_awq_int4 --QM QM_CUDA

4.4 编译并启动聊天

根据您的平台，修改 Makefile 中的相应配置，然后编译并启动聊天：

make chat -j

5. 项目处理脚本

TinyChatEngine 提供了一些处理脚本，用于下载和转换模型。以下是一些常用的脚本：

5.1 下载模型脚本

python tools/download_model.py --model <模型名称> --QM <量化方法>

5.2 编译脚本

make chat -j

5.3 启动聊天脚本

./chat

通过以上步骤，您可以成功下载并安装 TinyChatEngine 项目，并开始在您的设备上运行大型语言模型和视觉语言模型。

TinyChatEngine

TinyChatEngine: On-Device LLM Inference Library

项目地址：https://gitcode.com/gh_mirrors/ti/TinyChatEngine

项目优选

收起

MateChat

前端智能化场景解决方案UI库，轻松构建你的AI应用，我们将持续完善更新，欢迎你的使用与建议。官网地址：https://matechat.gitcode.com

本仓将收集和展示高质量的仓颉示例代码，欢迎大家投稿，让全世界看到您的妙趣设计，也让更多人通过您的编码理解和喜爱仓颉语言。

Cangjie

205

Ffit-framework

FIT: 企业级AI开发框架，提供多语言函数引擎（FIT）、流式编排引擎（WaterFlow）及Java生态的LangChain替代方案（FEL）。原生/Spring双模运行，支持插件热插拔与智能聚散部署，无缝统一大模型与业务系统。

Java

113

RuoYi-Cloud-Vue3

🎉 基于Spring Boot、Spring Cloud & Alibaba、Vue3 & Vite、Element Plus的分布式前后端分离微服务架构权限管理系统

Vue

cjoy

a fast，lightweight and joy web framework

Cangjie

HarmonyOS-Examples

本仓将收集和展示仓颉鸿蒙应用示例代码，欢迎大家投稿，在仓颉鸿蒙社区展现你的妙趣设计！

Cangjie

286

hertz

Go 微服务 HTTP 框架，具有高易用性、高性能、高扩展性等特点。

openHiTLS

旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件，通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求，让密码技术应用更简单，同时探索后量子等先进算法创新实践，构建密码前沿技术底座！

open-eBackup

open-eBackup是一款开源备份软件，采用集群高扩展架构，通过应用备份通用框架、并行备份等技术，为主流数据库、虚拟化、文件系统、大数据等应用提供E2E的数据备份、恢复等能力，帮助用户实现关键数据高效保护。

HTML

TinyChatEngine 项目下载及安装教程

1. 项目介绍

2. 项目下载位置

3. 项目安装环境配置

3.1 MacOS 环境配置

3.2 Windows 环境配置

3.2.1 Windows with CPU

3.2.2 Windows with Nvidia GPU (实验性)

4. 项目安装方式

4.1 下载项目

4.2 安装 Python 包

4.3 下载量化模型

4.3.1 x86 设备

4.3.2 ARM 设备

4.3.3 CUDA 设备

4.4 编译并启动聊天

5. 项目处理脚本

5.1 下载模型脚本

5.2 编译脚本

5.3 启动聊天脚本

热门内容推荐

最新内容推荐

项目优选

TinyChatEngine 项目下载及安装教程

1. 项目介绍

2. 项目下载位置

3. 项目安装环境配置

3.1 MacOS 环境配置

3.2 Windows 环境配置

3.2.1 Windows with CPU

3.2.2 Windows with Nvidia GPU (实验性)

4. 项目安装方式

4.1 下载项目

4.2 安装 Python 包

4.3 下载量化模型

4.3.1 x86 设备

4.3.2 ARM 设备

4.3.3 CUDA 设备

4.4 编译并启动聊天

5. 项目处理脚本

5.1 下载模型脚本

5.2 编译脚本

5.3 启动聊天脚本

相关内容推荐

热门内容推荐

最新内容推荐

项目优选