Stable Diffusion WebUI AMD GPU 版本 VRAM 占用异常问题分析

2025-07-04 06:37:48作者：胡唯隽

问题现象

在使用基于AMD显卡的Stable Diffusion WebUI DirectML版本时，用户报告了严重的VRAM管理问题。主要症状包括：

16GB显存的RX 7800 XT显卡在生成640x360以上分辨率的图像时就会报显存不足错误
问题出现后，venv环境会自我损坏，导致无法启动
环境会自动将Python版本从3.10.6更改为3.11，即使用户并未安装该版本
问题具有渐进性，初期可能生成少量图像后才会出现

技术分析

显存占用异常

根据用户反馈和技术分析，问题核心在于torch-directml的显存管理机制。典型表现为：

启动WebUI后，GPU显存立即被占用至接近满载(如15.8/16GB)
实际图像生成时，可用显存不足导致失败
问题在生成较大分辨率图像(如560x768)时尤为明显

环境自毁问题

venv环境损坏现象表明：

项目可能依赖特定Python版本(3.10.6)，但环境配置存在缺陷
显存耗尽可能导致进程异常终止，进而破坏环境完整性
环境重建后问题暂时缓解，但会再次出现

解决方案

临时解决方法

删除venv文件夹，让系统重新生成环境
确保requirements_versions.txt中指定torch-directml而非普通torch
重新运行webui-user.bat进行环境初始化

长期建议

考虑使用ROCm环境(Linux平台)替代DirectML
可尝试ZLUDA项目改善显存管理
降低工作分辨率或使用更小模型

技术背景

AMD显卡在Windows平台主要通过DirectML实现AI加速，相比NVIDIA的CUDA生态，在显存管理和性能优化上仍有差距。此问题反映了DirectML实现中的显存预分配和释放机制可能存在问题，特别是在连续处理多个生成任务时。

对于专业用户，迁移到Linux平台使用ROCm可能是更稳定的选择。普通用户则需要注意控制工作负载，避免触发显存耗尽的情况。

项目维护者已确认此问题与torch-directml实现相关，建议用户探索替代方案以获得更好的使用体验。

登录后查看全文

项目优选

收起

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

flutter_flutter

Oohos_react_native

React Native鸿蒙化仓库

昇腾LLM分布式训练框架

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统