Stable Diffusion WebUI AMDGPU 版本 GPU 驱动问题排查指南

2025-07-04 06:57:27作者：滕妙奇

stable-diffusion-webui-amdgpu

Stable Diffusion web UI

项目地址：https://gitcode.com/gh_mirrors/st/stable-diffusion-webui-amdgpu

问题现象分析

在 Stable Diffusion WebUI AMDGPU 版本的使用过程中，用户遇到了一个典型的 GPU 加速失效问题。具体表现为：

当使用 CPU 模式运行时（通过 --skip-torch-cuda-test 参数），系统能够正常工作，但生成速度极慢
当尝试启用 DirectML GPU 加速（通过 --use-directml 参数）时，模型加载失败并抛出 RuntimeError
错误日志显示在 transformers 模块处理 CLIP 文本编码时出现了未知错误

技术背景解析

Stable Diffusion WebUI AMDGPU 版本是专为 AMD 显卡优化的分支版本，它通过 DirectML 技术实现 GPU 加速。DirectML 是微软推出的 DirectX 12 组件，专门用于机器学习计算加速。

当系统出现上述问题时，通常意味着 GPU 计算管线中的某个环节出现了异常。可能的原因包括：

显卡驱动不兼容或损坏
DirectX 运行时组件缺失
Python 环境配置错误
显存管理问题

详细排查过程

1. 错误日志分析

从错误日志中可以观察到几个关键点：

ONNX 运行时初始化失败，提示 DLL 加载错误
在 transformers 模块处理 CLIP 文本编码时出现 RuntimeError
错误发生在将 mask 张量转换为特定数据类型的操作上

这些现象表明，GPU 计算管线在初始化阶段就遇到了问题，无法正常执行张量运算。

2. 环境验证

建议进行以下环境检查：

显卡驱动验证：
- 确认安装了最新版本的 AMD 显卡驱动
- 对于专业显卡（如 FirePro 系列），需要使用专业版驱动
DirectX 验证：
- 运行 dxdiag 检查 DirectX 功能是否正常
- 确保系统安装了最新版本的 DirectX 运行时
Python 环境检查：
- 确认使用官方推荐的 Python 3.10.6 或 3.10.11 版本
- 检查虚拟环境中是否正确安装了所有依赖项

3. 解决方案实施

经过深入排查，发现问题根源在于显卡驱动。解决方案如下：

完全卸载现有驱动：
- 使用 AMD 官方卸载工具或 DDU（Display Driver Uninstaller）
- 确保彻底清除所有驱动组件
重新安装驱动：
- 从 AMD 官网下载与显卡型号匹配的最新驱动
- 对于专业显卡，选择 Pro 版驱动而非普通游戏驱动
系统重启：
- 完成驱动安装后必须重启系统

技术要点总结

驱动兼容性： AMD 显卡驱动对 DirectML 的支持至关重要，特别是对于专业显卡和工作站显卡。
环境隔离：使用 Python 虚拟环境可以有效避免依赖冲突，但驱动问题仍会影响整个系统。
错误诊断：当 GPU 加速失败时，应首先检查基础计算环境（驱动、DirectX）而非直接怀疑应用代码。

最佳实践建议

定期更新驱动：保持显卡驱动为最新版本，特别是使用 AI 计算功能时。
使用专用卸载工具：在更换驱动版本时，使用专用工具确保彻底清理。
系统环境监控：使用 GPU-Z 等工具监控 GPU 状态，确保计算功能正常。
分步验证：遇到问题时，先验证基础功能（如简单的张量运算），再排查复杂模型。

通过以上方法，可以有效解决 Stable Diffusion WebUI AMDGPU 版本中的 GPU 加速问题，确保 AI 图像生成的高效运行。

stable-diffusion-webui-amdgpu

Stable Diffusion web UI

项目地址：https://gitcode.com/gh_mirrors/st/stable-diffusion-webui-amdgpu

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

昇腾LLM分布式训练框架

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

flutter_flutter

ohos_react_native

React Native鸿蒙化仓库

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力