Stable-Diffusion-WebUI-TensorRT模型导出内存问题分析与解决方案

2025-07-05 12:48:08作者：仰钰奇

问题背景

在使用Stable-Diffusion-WebUI-TensorRT插件进行模型导出时，许多用户遇到了内存使用异常高的问题。具体表现为在将模型导出为ONNX格式时，显存使用量从正常的6GB突然飙升到显卡的全部24GB容量，当显存耗尽后还会继续占用14-16GB的系统内存。这种异常的内存消耗不仅影响系统稳定性，还可能导致导出过程失败。

问题现象

用户在尝试导出模型时观察到以下典型现象：

显存使用量异常增长，远超正常水平
当显存耗尽后，系统开始大量使用内存
最终可能导致导出失败，出现"Exporting to ONNX failed"错误
问题在使用静态形状(static shapes)导出时尤为明显，特别是当设置batch size为4，分辨率为512x768，token count为75时

可能原因分析

经过技术社区的研究，这个问题可能与以下几个因素有关：

PyTorch版本问题：某些PyTorch版本在模型导出时存在内存管理缺陷，特别是在处理大模型转换时可能导致内存泄漏。
TensorRT插件兼容性问题：插件与WebUI版本的兼容性不佳，特别是在较新的WebUI版本中。
导出参数设置不当：某些导出参数组合可能触发内存异常增长。

解决方案

经过社区验证，以下解决方案可以有效缓解或解决该问题：

升级软件环境：
- 更新到WebUI 1.8.0或更高版本
- 确保使用最新版本的PyTorch和xformers
- 重新安装TensorRT插件
分步导出策略：
- 首先使用基础预设(如256x256-512x512分辨率，batch size 1-4)生成TRT模型
- 然后再使用其他预设进行导出
- 这种方法可以避免直接使用高参数导出时出现的问题
内存管理优化：
- 在导出前确保显存充足
- 关闭其他占用显存的程序
- 考虑使用较小的batch size进行导出