Stable Diffusion WebUI AMDGPU 在 Ryzen 平台上的 DirectML 内存管理问题分析

2025-07-04 04:06:52作者：羿妍玫Ivan

stable-diffusion-webui-amdgpu

Stable Diffusion web UI

项目地址：https://gitcode.com/gh_mirrors/st/stable-diffusion-webui-amdgpu

问题背景

在 Windows 系统下使用 Stable Diffusion WebUI AMDGPU 项目时，搭载 AMD Ryzen 3 5300G APU 的用户遇到了严重的系统稳定性问题。当共享显存（动态内存）使用量超过 16GB 时，系统会出现蓝屏死机（BSOD）。这一问题主要出现在使用 DirectML 后端的情况下，对使用 AMD 集成显卡的用户影响尤为显著。

技术分析

内存管理机制

DirectML 的内存管理机制存在一个关键特性：一旦分配了内存空间，这些内存将不会被释放，直到整个进程终止。这意味着：

内存不会被逐层释放
内存泄漏现象不可避免
内存使用量会随着生成过程不断累积

问题表现

具体表现为：

生成较大尺寸图像（约1百万像素）时，共享显存使用量可达12-14GB
批量生成时内存使用量会持续增长
超过16GB阈值后直接导致系统蓝屏崩溃

解决方案探讨

现有临时解决方案

目前用户采用的是一种进程重启方案，主要思路是：

监控内存使用量
当接近阈值时自动重启WebUI进程
通过批处理文件实现自动化

虽然这种方法能够避免系统崩溃，但存在以下缺陷：

无法在生成过程中及时更新Web界面
批量生成时无法实时监控内存
用户体验不连贯

更优解决方案建议

从技术实现角度，可以考虑以下改进方向：

进程外监控方案
- 实现一个独立的内存监控进程
- 采用进程间通信机制
- 在内存接近阈值时安全终止并重启生成进程
生成任务分片处理
- 将大型生成任务拆分为多个子任务
- 每个子任务完成后强制释放资源
- 需要设计任务状态保存机制
资源使用优化
- 更精细的内存使用监控
- 动态调整生成参数
- 实现提醒机制而非被动重启

技术建议

对于使用类似配置的用户，建议：

考虑迁移到Linux平台使用ROCm后端，可获得更好的内存管理
如果必须使用Windows+DirectML组合：
- 严格控制生成图像尺寸
- 避免长时间连续生成
- 定期手动重启WebUI进程
- 使用内存监控工具设置提醒

总结

AMD集成显卡在Windows平台使用DirectML后端时确实存在内存管理方面的固有限制。虽然通过进程重启可以暂时规避系统崩溃问题，但最根本的解决方案还是考虑使用其他计算后端或平台。随着AMD对ROCm支持的不断完善，Linux平台可能成为更稳定的选择。

stable-diffusion-webui-amdgpu

Stable Diffusion web UI

项目地址：https://gitcode.com/gh_mirrors/st/stable-diffusion-webui-amdgpu

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

昇腾LLM分布式训练框架

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统