Stable Diffusion WebUI DirectML项目中的GPU存储恢复问题分析

2025-07-04 08:43:50作者：袁立春Spencer

问题背景

在Stable Diffusion WebUI DirectML项目中，当用户尝试使用某些特定模型（如R-ESRGAN、R-ESRGAN-ANIME、DAT、SwinIR等）进行高分辨率修复（highrex fix）时，系统会抛出运行时错误："don't know how to restore data location of torch.storage.UntypedStorage (tagged with privateuseone:0)"。这个问题主要影响使用DirectML后端在AMD/Intel/NVIDIA GPU上运行Stable Diffusion的用户。

技术分析

错误根源

该错误的核心在于PyTorch的存储恢复机制与DirectML后端的兼容性问题。当系统尝试加载模型权重时，PyTorch无法正确处理标记为"privateuseone:0"的存储位置。这种存储位置标记通常用于自定义设备或特殊后端，而DirectML目前尚未完全实现对此类存储位置的恢复支持。

影响范围

此问题主要影响以下场景：

使用Real-ESRGAN系列模型进行超分辨率处理
使用某些特定的图像修复模型
在Windows平台使用DirectML后端进行GPU加速

深层原因

问题的根本原因在于DirectML驱动层对PyTorch存储恢复机制的支持不完整。当PyTorch尝试将模型权重恢复到GPU内存时，DirectML无法正确识别和处理"privateuseone"这一特殊设备标记，导致存储恢复失败。

解决方案

临时解决方案

使用替代后端：考虑使用ZLUDA或SD.Next等替代方案，这些后端对PyTorch的存储恢复机制有更好的支持。
更换模型：使用其他兼容性更好的超分辨率模型，如SwinIR或ScuNET，这些模型在DirectML后端下表现更稳定。
等待官方修复：微软DirectML团队已意识到此问题，并正在开发修复方案。

长期展望

随着DirectML生态的不断完善，预计未来版本将解决此类存储恢复问题。开发者可以关注DirectML的更新日志，及时获取兼容性改进信息。

技术建议

对于需要在DirectML环境下稳定运行Stable Diffusion的用户，建议：

定期检查DirectML驱动更新
在模型选择时优先考虑已知兼容性良好的模型
对于关键工作流程，准备备用方案（如CPU模式或兼容性更好的后端）

这个问题虽然影响特定功能的使用，但通过合理的规避措施和工作流程调整，仍然可以在DirectML环境下获得良好的Stable Diffusion使用体验。

登录后查看全文

项目优选

收起

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。

Oohos_react_native

React Native鸿蒙化仓库