Stable Diffusion WebUI DirectML 在 AMD RX580 显卡上的 ZLUDA 兼容性问题解决方案

2025-07-04 00:06:32作者：仰钰奇

探索 Stable Diffusion 的 Web 界面，专为 AMD GPU 设计！一键安装，轻松运行。享受原生的文本转图像和图像转图像模式，外画、内补、色彩素描等创意功能。利用关注点控制模型注意力，实时预览生成过程。集成 GFPGAN、代码恢复工具等增强特性，支持自定义 Python 代码执行，打造个性化艺术作品。还能进行批量处理和无限生成选项，让你的创造力无限飞翔！

项目地址：https://gitcode.com/gh_mirrors/st/stable-diffusion-webui-directml

问题背景

在使用 Stable Diffusion WebUI DirectML 项目时，部分 AMD RX580 显卡用户遇到了模型加载失败的问题。具体表现为启动 WebUI 后无法加载任何检查点模型，控制台报错显示设备内存分配异常和 CUDA 设备不匹配的错误。

错误现象分析

从错误日志中可以观察到几个关键问题点：

设备初始化失败：日志显示"ZLUDA device failed to pass basic operation test"，表明 ZLUDA 运行时在基础操作测试阶段就遇到了问题。
内存分配异常：出现"CUDA error: out of memory"错误，但实际显卡内存并未耗尽。
设备不匹配：最终导致模型加载失败的关键错误是"Expected all tensors to be on the same device, but found at least two devices, cuda:0 and cpu"，表明系统无法正确处理 CUDA 和 CPU 之间的数据传输。

根本原因

经过技术分析，这个问题源于 AMD Polaris 架构显卡（包括 RX580）在驱动层面的一个已知问题：

驱动内存管理缺陷：Polaris GPU 驱动在处理系统内存时可能会错误地报告内存不足。
ZLUDA 兼容性问题：ZLUDA 运行时与特定版本的 PyTorch 存在兼容性问题。
驱动版本影响：不同版本的 AMD 驱动程序对 ZLUDA 的支持程度不同。

解决方案

方案一：使用专业版驱动

完全卸载现有显卡驱动（推荐使用专业卸载工具）
安装最新版 AMD PRO 版驱动程序
重新安装 HIP SDK

方案二：降级 PyTorch 版本（推荐）

对于大多数 RX580 用户，降级 PyTorch 和相关组件是最有效的解决方案：

在 WebUI 的虚拟环境中执行以下命令：

pip install torch==2.0.1 torchvision==0.15.2 torchaudio==2.0.2 --index-url https://download.pytorch.org/whl/cu118

确保所有相关组件版本兼容：

PyTorch: 2.0.1
TorchVision: 0.15.2
TorchAudio: 2.0.2

验证方法

安装完成后，可以通过以下方式验证 ZLUDA 是否正常工作：

在 WebUI 中尝试加载标准模型
执行简单的图像生成任务
观察控制台输出是否还有设备不匹配的错误

技术建议

内存优化：对于 RX580 这样的 8GB 显存显卡，建议使用 --medvram 参数启动 WebUI。
驱动选择：虽然专业版驱动可能更稳定，但最新的 Adrenalin 驱动（如 24.3.1）配合降级的 PyTorch 也能正常工作。
性能监控：使用 GPU-Z 等工具监控显存使用情况，确保没有内存泄漏。

总结

AMD RX580 显卡用户在使用 Stable Diffusion WebUI DirectML 配合 ZLUDA 时遇到的模型加载问题，主要源于驱动层面的内存管理问题和 PyTorch 版本兼容性。通过降级 PyTorch 到 2.0.1 版本，大多数用户都能解决这一问题。对于追求更高稳定性的用户，可以考虑使用 AMD 专业版驱动，但这不是必须的解决方案。

stable-diffusion-webui-directml

项目地址：https://gitcode.com/gh_mirrors/st/stable-diffusion-webui-directml

登录后查看全文