Stable Diffusion WebUI AMDGPU项目中的DirectML运行时错误分析与解决方案

2025-07-04 18:54:35作者：蔡丛锟

问题概述

在Stable Diffusion WebUI AMDGPU项目中，当用户尝试使用高分辨率修复(Hires Fix)功能时，系统会抛出"RuntimeError: don't know how to restore data location of torch.storage.UntypedStorage (tagged with privateuseone:0)"的错误。这个问题主要影响使用AMD显卡(如RX 580)的用户，特别是在Windows系统上通过DirectML后端运行Stable Diffusion的情况。

错误背景

该错误发生在图像处理流程的高分辨率放大阶段，具体是在加载RealESRGAN模型进行图像超分辨率处理时。系统尝试将模型权重加载到显存时，由于DirectML后端与PyTorch存储系统的兼容性问题，导致无法正确恢复存储位置。

技术分析

错误根源：PyTorch的存储系统(Storage)在DirectML后端下无法正确处理模型权重的设备位置映射。当RealESRGAN模型尝试将权重加载到标记为"privateuseone:0"(DirectML设备标识)的存储位置时，PyTorch的默认恢复机制无法识别这种设备类型。
影响范围：主要影响使用以下配置的用户：
- AMD显卡(特别是较旧的型号如RX 580)
- 使用DirectML后端
- 启用了高分辨率修复功能
- 使用RealESRGAN等需要额外模型的上采样器
环境因素：
- 与特定的AMD驱动版本可能存在关联
- 使用了一些优化参数如--opt-sub-quad-attention、--lowvram等

解决方案

版本回退：目前最稳定的解决方案是回退到WebUI的v1.7.0-amd版本。这个版本经过充分测试，对DirectML后端的支持更为成熟。
替代方案：如果必须使用最新版本，可以尝试以下方法：
- 更换其他上采样方法(如Lanczos或Nearest等不需要额外模型的方法)
- 禁用高分辨率修复功能
- 使用CPU进行上采样(虽然速度较慢)
长期建议：等待项目维护者发布针对DirectML后端的修复补丁，或者考虑切换到Linux系统使用ROCm后端，可能获得更好的兼容性。

技术展望

这个问题反映了PyTorch在非CUDA后端(特别是DirectML)支持上的一些局限性。随着AMD在AI领域的持续投入，预计未来会有更完善的解决方案：

PyTorch对DirectML后端的原生支持改进
AMD驱动的持续优化
Stable Diffusion生态对AMD硬件更好的适配

对于普通用户而言，目前最实用的方案还是使用经过充分测试的稳定版本，避免在关键工作流程中使用实验性功能。

登录后查看全文