InternLM/lmdeploy项目中源码安装Turbomind引擎指南

2025-06-03 00:35:10作者：宣聪麟

LMDeploy is a toolkit for compressing, deploying, and serving LLMs.

项目地址：https://gitcode.com/gh_mirrors/lm/lmdeploy

在InternLM/lmdeploy项目中，Turbomind是一个重要的推理引擎组件。很多开发者在使用源码安装时会遇到找不到Turbomind模块的问题。本文将详细介绍如何从源码正确安装包含Turbomind引擎的完整lmdeploy环境。

安装前的准备工作

首先需要确保系统环境满足以下要求：

操作系统：推荐使用Linux系统（如Ubuntu 20.04或更高版本）
Python版本：3.8或更高版本
编译器：GCC 9.0或更高版本
CUDA环境：11.7或更高版本（如果使用GPU加速）

完整安装步骤

克隆源码仓库 使用git命令克隆lmdeploy项目的源码到本地：
```
git clone https://github.com/InternLM/lmdeploy.git
cd lmdeploy
```
安装系统依赖 在Ubuntu系统上需要先安装一些必要的系统库：
```
sudo apt-get update
sudo apt-get install -y build-essential cmake
```
创建Python虚拟环境（可选但推荐） 建议使用虚拟环境隔离安装：
```
python -m venv lmdeploy_env
source lmdeploy_env/bin/activate
```
安装Python依赖 安装项目所需的Python依赖包：
```
pip install -r requirements.txt
```
编译安装Turbomind引擎 这是关键步骤，需要确保正确编译Turbomind：
```
pip install -e .
```

验证安装

安装完成后，可以通过以下方式验证Turbomind是否安装成功：

在Python中尝试导入：
```
import turbomind
```
检查命令行工具：
```
lmdeploy --help
```

常见问题解决

如果在安装过程中遇到问题，可以尝试以下解决方案：

找不到Turbomind模块
- 确保执行了pip install -e .而不是普通的pip install .
- 检查编译过程中是否有错误输出
- 确认CUDA环境配置正确
编译错误
- 确保系统安装了足够新版本的GCC
- 检查CUDA版本是否匹配要求
- 可能需要安装额外的开发库
性能问题
- 确保系统支持AVX2指令集
- 对于GPU版本，检查CUDA驱动是否最新

最佳实践建议

建议在干净的Python环境中安装
对于生产环境，考虑使用预编译的二进制包
开发环境下，可以使用--verbose选项获取更详细的安装信息
定期更新源码仓库以获取最新修复和改进

通过以上步骤，开发者应该能够成功安装包含Turbomind引擎的完整lmdeploy环境，为后续的大模型推理任务做好准备。

LMDeploy is a toolkit for compressing, deploying, and serving LLMs.

项目地址：https://gitcode.com/gh_mirrors/lm/lmdeploy

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

flutter_flutter

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

ohos_react_native

React Native鸿蒙化仓库

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。