Stable-Diffusion-WebUI-DirectML项目GPU加速问题分析与解决方案

2025-07-04 14:38:23作者：殷蕙予

stable-diffusion-webui-directml

探索 Stable Diffusion 的 Web 界面，专为 AMD GPU 设计！一键安装，轻松运行。享受原生的文本转图像和图像转图像模式，外画、内补、色彩素描等创意功能。利用关注点控制模型注意力，实时预览生成过程。集成 GFPGAN、代码恢复工具等增强特性，支持自定义 Python 代码执行，打造个性化艺术作品。还能进行批量处理和无限生成选项，让你的创造力无限飞翔！

项目地址：https://gitcode.com/gh_mirrors/st/stable-diffusion-webui-directml

问题背景

在使用Stable-Diffusion-WebUI-DirectML项目时，用户遇到了无法启用GPU加速的问题。该问题表现为在更新项目版本后，系统无法正确识别GPU设备，导致计算性能下降。通过分析日志信息，我们可以深入了解这一问题的成因及解决方案。

问题现象分析

从日志信息中可以观察到几个关键现象：

GPU支持缺失警告：系统提示"bitsandbytes was compiled without GPU support"，表明GPU加速功能未被正确启用。
模块导入错误：出现"No module named 'keras.internal'"错误，这通常与TensorFlow/Keras版本不兼容有关。
扩展兼容性问题：部分扩展与WebUI v1.9.0版本存在兼容性问题，导致初始化失败。
执行提供者选择异常：日志显示ONNX运行时选择了CUDAExecutionProvider，而实际可用的是DmlExecutionProvider和CPUExecutionProvider。

根本原因

经过深入分析，问题的根本原因可以归结为以下几点：

版本兼容性问题：项目更新至v1.9.0后，部分依赖库（如TensorFlow/Keras）的版本与现有环境不兼容。
扩展冲突：某些扩展未能及时适配新版本WebUI，导致初始化过程中出现循环导入等问题。
配置参数缺失：未正确指定DirectML后端参数，导致系统默认尝试使用不支持的CUDA后端。

解决方案

针对上述问题，我们提供以下解决方案：

1. 版本回退

对于v1.9.0版本出现的兼容性问题，最直接的解决方案是回退到稳定版本：

git checkout tags/v1.8.0-amd

这一操作将项目切换至经过充分测试的v1.8.0版本，确保核心功能的稳定性。

2. 显式指定DirectML后端

在启动参数中明确指定使用DirectML后端：

--use-directml

这一参数强制系统使用Microsoft DirectML作为计算后端，确保AMD/NVIDIA显卡都能获得最佳支持。

3. 环境清理与重建

当遇到难以解决的依赖冲突时，建议彻底清理并重建Python虚拟环境：

删除现有虚拟环境目录（通常是venv文件夹）
重新运行安装脚本（webui.bat或webui.sh）
让系统自动重建依赖关系

4. 扩展管理

对于扩展引起的兼容性问题，可以采取以下措施：

临时禁用所有扩展（使用--disable-all-extensions参数）
逐一启用扩展，定位问题来源
联系扩展开发者获取更新版本

最佳实践建议

版本控制：在升级前，建议创建分支或备份当前工作版本，便于快速回退。
环境隔离：为不同项目创建独立的Python虚拟环境，避免依赖冲突。
日志分析：遇到问题时，仔细阅读控制台输出，通常包含有价值的诊断信息。
参数优化：根据硬件配置调整启动参数，如--medvram、--precision等，以获得最佳性能。

总结

Stable-Diffusion-WebUI-DirectML项目在Windows平台为AMD/NVIDIA显卡用户提供了优秀的AI绘图体验。遇到GPU加速问题时，通过版本管理、参数调整和环境重建等方法，大多数情况下都能有效解决。建议用户保持关注项目更新，及时获取最新的兼容性改进和性能优化。

stable-diffusion-webui-directml

探索 Stable Diffusion 的 Web 界面，专为 AMD GPU 设计！一键安装，轻松运行。享受原生的文本转图像和图像转图像模式，外画、内补、色彩素描等创意功能。利用关注点控制模型注意力，实时预览生成过程。集成 GFPGAN、代码恢复工具等增强特性，支持自定义 Python 代码执行，打造个性化艺术作品。还能进行批量处理和无限生成选项，让你的创造力无限飞翔！

项目地址：https://gitcode.com/gh_mirrors/st/stable-diffusion-webui-directml

登录后查看全文

最新内容推荐

Python Django图书借阅管理系统：高效智能的图书馆管理解决方案 LabVIEW串口通信开发全攻略：从入门到精通的完整解决方案操作系统概念第六版PDF资源全面指南：适用场景与使用教程谷歌浏览器跨域插件Allow-Control-Allow-Origin：前端开发调试必备神器 Python开发者的macOS终极指南：VSCode安装配置全攻略深入解析Windows内核模式驱动管理器：系统驱动管理的终极利器 Windows Server 2016 .NET Framework 3.5 SXS文件下载与安装完整指南基恩士LJ-X8000A开发版SDK样本程序全面指南 - 工业激光轮廓仪开发利器 SteamVR 1.2.3 Unity插件：兼容Unity 2019及更低版本的VR开发终极解决方案 MQTT客户端软件源代码：物联网开发的强大工具与最佳实践指南

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

flutter_flutter

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理

基于golang开发的网关。具有各种插件，可以自行扩展，即插即用。此外，它可以快速帮助企业管理API服务，提高API服务的稳定性和安全性。