【亲测免费】 TensorRT 扩展用于 Stable Diffusion Web UI 教程

2026-01-16 09:28:39作者：沈韬淼Beryl

Stable-Diffusion-WebUI-TensorRT

TensorRT Extension for Stable Diffusion Web UI

项目地址：https://gitcode.com/gh_mirrors/st/Stable-Diffusion-WebUI-TensorRT

1. 项目介绍

TensorRT 扩展是专为 Automatic1111 的 Stable Diffusion Web 用户界面设计的一个优化组件，它利用 NVIDIA RTX 显卡的 Tensor 核心来提升性能，实现文本到图像和图像到图像生成模型的加速。通过该扩展，Stable Diffusion 的运行速度可以翻倍，为用户提供更高效且高质量的图像生成体验。

2. 项目快速启动

环境要求

GPU：NVIDIA RTX GPU，至少 8GB 显存
内存：16GB RAM
驱动：NVIDIA Studio Driver 537.58 或更高版本

安装步骤

安装 Stable Diffusion Web UI
- 下载 sd_webui.zip
- 将下载的文件移动到本地有足够的硬盘空间（推荐20GB以上）
- 解压 sd_webui.zip
- 在解压后的目录中，运行 update.bat 更新到最新版本

安装 TensorRT 扩展

克隆本项目至本地：

git clone https://github.com/NVIDIA/Stable-Diffusion-WebUI-TensorRT.git

生成 TensorRT 引擎
- 运行以下命令以生成对应分辨率的引擎：
```
python build_engines.py --width <image_width> --height <image_height>
```
配置 Stable Diffusion
- 修改 stable_diffusion/webui/config.json 文件，设置 "use_tensorrt": true 并提供引擎路径。

启动 Web UI

进入稳定扩散的Web UI目录：
```
cd stable_diffusion/webui
```
启动服务：
```
python app.py
```
访问 http://localhost:5000 以开始使用。

3. 应用案例和最佳实践

使用高分辨率进行图像生成，利用 TensorRT 加速以减少等待时间。
对于实时或批量任务，确保系统资源充足以达到最佳性能。
实时监控GPU温度和负载，以避免过热或过度使用。

4. 典型生态项目

Automatic1111/stable-diffusion-webui：基础的 Stable Diffusion Web UI 项目，提供了用户友好的界面。
NVIDIA/DeepLearningExamples：包含了多种深度学习模型的示例，包括如何在 TensorRT 上部署其他模型。

此教程概述了 TensorRT 扩展的安装和使用过程，以及相关最佳实践。通过遵循这些步骤，您可以充分利用 NVIDIA GPU 的能力，提高 Stable Diffusion 的工作效率。

Stable-Diffusion-WebUI-TensorRT

TensorRT Extension for Stable Diffusion Web UI

项目地址：https://gitcode.com/gh_mirrors/st/Stable-Diffusion-WebUI-TensorRT

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

昇腾LLM分布式训练框架

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

flutter_flutter

ohos_react_native

React Native鸿蒙化仓库

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力