在AMD显卡上使用stable-diffusion-webui-directml项目的配置指南

2025-07-04 09:37:44作者：田桥桑Industrious

探索 Stable Diffusion 的 Web 界面，专为 AMD GPU 设计！一键安装，轻松运行。享受原生的文本转图像和图像转图像模式，外画、内补、色彩素描等创意功能。利用关注点控制模型注意力，实时预览生成过程。集成 GFPGAN、代码恢复工具等增强特性，支持自定义 Python 代码执行，打造个性化艺术作品。还能进行批量处理和无限生成选项，让你的创造力无限飞翔！

项目地址：https://gitcode.com/gh_mirrors/st/stable-diffusion-webui-directml

项目背景

stable-diffusion-webui-directml是专为AMD显卡用户优化的Stable Diffusion WebUI分支版本。它通过微软DirectML技术让AMD显卡也能高效运行AI绘画模型，解决了原生版本仅支持NVIDIA CUDA的限制。

环境准备

要成功运行该项目，需要准备以下环境：

操作系统：Windows 10或更高版本
显卡：AMD Radeon系列（如文中提到的6500XT）
Python环境：推荐3.10.6版本
显卡驱动：确保已安装最新版AMD驱动

安装步骤详解

基础安装

克隆项目仓库到本地
创建Python虚拟环境
安装必要的Python依赖包

安装过程中会自动下载：

PyTorch 2.0.0（CPU版本）
torch-directml 0.2.0.dev230426
其他必要的AI相关库

常见安装问题解决

在安装过程中可能会遇到以下问题：

Torch无法使用GPU的报错：这是正常现象，因为DirectML使用的是特殊的PyTorch版本
ZLUDA相关警告：可以忽略，除非你明确要使用ZLUDA技术
xformers缺失警告：不影响基本功能，可以后续单独安装

模型加载问题排查

模型加载失败通常表现为"safetensors_rust.SafetensorError: Error while deserializing header: MetadataIncompleteBuffer"错误。这可能是由于：

模型文件下载不完整
模型文件损坏
存储设备读写问题

解决方法：

重新下载模型文件
检查文件完整性（比对文件大小和MD5值）
尝试更换存储位置（如从机械硬盘转移到SSD）

性能优化建议

使用--opt-sub-quad-attention参数优化注意力机制
对于显存较小的显卡（如6500XT），添加--lowvram参数
禁用NaN检查可提升性能（--disable-nan-check）
根据实际需求调整批处理大小

使用注意事项

首次运行会自动下载基础模型，请确保网络畅通
模型文件较大（通常3-4GB），需要足够的存储空间
生成图片时显存占用较高，建议关闭其他图形密集型应用
不同AMD显卡性能差异较大，需要适当调整参数

进阶配置

对于有经验的用户，可以尝试：

自定义DirectML参数优化性能
集成其他优化技术如xformers
调整ONNX运行时参数
针对特定型号显卡进行微调

通过以上配置，AMD显卡用户也能获得良好的Stable Diffusion使用体验。虽然性能可能不及同级别NVIDIA显卡，但通过合理优化仍能满足日常创作需求。

stable-diffusion-webui-directml

项目地址：https://gitcode.com/gh_mirrors/st/stable-diffusion-webui-directml

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

nop-entropy

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

350

203

pytorch

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理