TensorRT-LLM 安装与使用指南

2024-08-07 05:03:03作者：咎竹峻Karen

TensorRT-LLM provides users with an easy-to-use Python API to define Large Language Models (LLMs) and build TensorRT engines that contain state-of-the-art optimizations to perform inference efficiently on NVIDIA GPUs. TensorRT-LLM also contains components to create Python and C++ runtimes that execute those TensorRT engines.

项目地址：https://gitcode.com/gh_mirrors/te/TensorRT-LLM

目录结构与介绍

打开你的终端或命令行界面，执行以下命令以克隆 TensorRT-LLM 的仓库：

git clone https://github.com/NVIDIA/TensorRT-LLM.git
cd TensorRT-LLM

完成克隆后，你会看到如下的主要目录结构:

examples/: 包含了各种模型的例子，例如GPT系列。
include/: 包含了TensorRT-LLM的核心C++头文件。
src/: 包括了源代码文件，这些用于构建TensorRT-LLM的各个组件。
scripts/: 提供了自动化脚本，如编译和测试脚本等。
doc/: 文档目录，包含API参考、快速入门指南等。

启动文件介绍

TensorRT-LLM 没有一个单一的“主”运行文件，因为它的设计更倾向于一个库或者框架，其核心在于编译定义好的语言模型到TensorRT引擎并进行推理。然而，在 examples/ 目录下你可以找到多个示例脚本，比如 build_gpt2.py, 这些脚本就是用来演示如何定义模型以及编译和运行模型的。

构建流程概述

在 examples/gpt 文件夹中，查找 build_gpt2.py 脚本来了解模型构建的细节。
使用 python build_gpt2.py --help 来查看可用参数。
根据需求编辑并运行相应的脚本。

配置文件介绍

TensorRT-LLM 并没有传统的配置文件，大多数设置都是通过构建模型时提供的命令行参数或者在脚本中的变量定义来实现的。例如，在 examples/gpt/build_gpt2.py 中，可以看到有许多可以调整的参数，包括但不限于：

model_config: 这个字典包含了模型架构的具体设置，如层的数量、嵌入维度大小等。
profile: 这用于定义推理过程中不同的输入形状范围，这对于优化TensorRT引擎至关重要。
builder_config: 控制TensorRT构建器的行为，如最大工作区大小、精度模式（FP32, FP16, INT8）等。

对于那些熟悉PyTorch的人们来说，TensorRT-LLM的Python API会非常直观且易于上手。你可以在doc/getting_started.rst这个文档中找到详细的步骤指导。

以上是基于该项目的初步介绍。具体使用前，请确保已经详细阅读了官方文档以获取最新和最全面的信息。如果你遇到任何技术上的问题，欢迎查阅项目内的Issue列表，也可能在那里找到解决之道。

TensorRT-LLM provides users with an easy-to-use Python API to define Large Language Models (LLMs) and build TensorRT engines that contain state-of-the-art optimizations to perform inference efficiently on NVIDIA GPUs. TensorRT-LLM also contains components to create Python and C++ runtimes that execute those TensorRT engines.

项目地址：https://gitcode.com/gh_mirrors/te/TensorRT-LLM

热门内容推荐

1 开发者路线图项目教程 2 开源项目 developer-roadmap 使用教程 3 Vue.js 教程与指南 4 开源项目教程：awesome-selfhosted 5 开源项目 `awesome-selfhosted` 使用教程 6 TensorFlow 开源项目指南 7 TensorFlow 开源项目教程 8 TensorFlow：开启机器学习新纪元 9 Linux 内核项目使用教程 10 推荐项目：探索 Linux 内核的奥秘

最新内容推荐

《Arduino-heatpumpir：打造自己的空调遥控器》探索数据库加速：Silo系统的安装与使用指南《SIFTGPU：在GPU上实现尺度不变特征变换的安装与使用教程》探索Pandana：强大的Python网络分析库安装与使用指南探索Nonius：轻量级C++代码微基准测试框架探索开源漫画阅读器ComicFlow：安装与使用教程《Manta安装与使用详解：轻松掌握结构变异分析工具》《ArduinoUnit测试框架使用指南》《USB Cam：开启ROS 2相机之旅》《MapMap视频映射软件的安装与使用指南》

项目优选

收起

Python-100-Days

Python - 100天从新手到大师

国产编程语言蓝皮书

《国产编程语言蓝皮书》-编委会工作区

Cangjie-Examples

本仓将收集和展示高质量的仓颉示例代码，欢迎大家投稿，让全世界看到您的妙趣设计，也让更多人通过您的编码理解和喜爱仓颉语言。

旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件，通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求，让密码技术应用更简单，同时探索后量子等先进算法创新实践，构建密码前沿技术底座！

HarmonyOS-Examples

本仓将收集和展示仓颉鸿蒙应用示例代码，欢迎大家投稿，在仓颉鸿蒙社区展现你的妙趣设计！

为键盘工作者设计的单词记忆与英语肌肉记忆锻炼软件 / Words learning and English muscle memory training software designed for keyboard workers

CangjieCommunity

为仓颉编程语言开发者打造活跃、开放、高质量的社区环境

Advanced-Java是一个Java进阶教程，适合用于学习Java高级特性和编程技巧。特点：内容深入、实例丰富、适合进阶学习。

前端智能化场景解决方案UI库，轻松构建你的AI应用，我们将持续完善更新，欢迎你的使用与建议。官网地址：https://matechat.gitcode.com

HarmonyOS-Cangjie-Cases

参考 HarmonyOS-Cases/Cases，提供仓颉开发鸿蒙 NEXT 应用的案例集