Stable Diffusion WebUI TensorRT 扩展教程

2024-08-18 20:53:26作者：吴年前Myrtle

项目介绍

Stable Diffusion WebUI TensorRT 扩展是一个用于提升 Stable Diffusion WebUI 性能的开源项目。该项目通过利用 NVIDIA RTX GPU 中的 Tensor Cores，将 Stable Diffusion 的性能提升一倍。本扩展适用于 Automatic1111 的 Stable Diffusion 分布，这是目前最流行的 Stable Diffusion 版本。

项目快速启动

安装步骤

克隆项目仓库：

git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui-tensorrt.git
cd stable-diffusion-webui-tensorrt

下载并解压 TensorRT：
- 从 NVIDIA 下载与 Python 的 torch 库版本匹配的 TensorRT zip 文件。
- 例如，对于 torch 2.0.1，下载 CUDA 11.8 版本的 TensorRT。
- 将 zip 文件解压到扩展目录中，确保 TensorRT-8.6.1.6 目录与 scripts 目录和 trt_path.py 文件在同一位置。
重启 WebUI：
```
# 重启 WebUI 的命令
```

使用步骤

选择模型并生成图片：
- 在 WebUI 中选择要优化的模型，并生成包含所需 LoRAs 和超网络的图片。
转换模型：
- 进入 Convert to ONNX 标签页，点击 Convert Unet to ONNX。
- 转换完成后，在 models/Unet-onnx 目录中找到 ONNX 文件。
- 进入 Convert ONNX to TensorRT 标签页，配置必要参数并点击 Convert ONNX to TensorRT。
- 转换完成后，在 models/Unet-trt 目录中找到 TensorRT 文件。
设置 Stable Diffusion：
- 在 Stable Diffusion 页面中，使用 SD Unet 选项选择新生成的 TensorRT 模型。
生成图片：
- 使用 Stable Diffusion 2.0 生成图片。

应用案例和最佳实践

案例一：图像生成加速

通过使用 TensorRT 扩展，用户可以在保持图像质量的同时，显著减少图像生成时间。这对于需要大量图像生成的应用场景（如游戏开发、电影制作等）非常有用。

案例二：实时图像处理

在实时图像处理应用中，TensorRT 扩展可以提供更快的响应时间，使得实时图像编辑和渲染成为可能。这对于视频直播、在线教育等领域具有重要意义。

最佳实践

保持驱动程序更新：确保 NVIDIA 驱动程序是最新的，以获得系统范围内的性能改进。
合理配置参数：在转换模型时，合理配置参数以平衡性能和资源消耗。
监控资源使用：在转换过程中，监控 VRAM 使用情况，必要时手动运行转换命令以释放资源。

典型生态项目

Automatic1111 的 Stable Diffusion 分布

Automatic1111 的 Stable Diffusion 分布是目前最流行的 Stable Diffusion 版本，提供了丰富的功能和良好的社区支持。TensorRT 扩展与其紧密集成，为用户提供了高性能的图像生成解决方案。

NVIDIA TensorRT

NVIDIA TensorRT 是一个高性能深度学习推理库，适用于从云端到边缘的各种应用。通过与 Stable Diffusion WebUI 的结合，TensorRT 扩展进一步提升了深度学习模型的推理性能。

ONNX 转换工具

ONNX（Open Neural Network Exchange）是一个开放的深度学习模型交换格式，允许模型在不同的深度学习框架之间进行转换。TensorRT 扩展利用 ONNX 转换工具，简化了模型从 PyTorch 到 TensorRT 的转换过程。

通过以上模块的介绍和实践，用户可以充分利用 Stable Diffusion WebUI TensorRT 扩展，提升图像生成和处理的性能。

登录后查看全文

项目优选

收起

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

deepin linux kernel

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。