Stable-Diffusion-Webui-DirectML项目在AMD显卡上的部署与优化指南

2025-07-04 07:47:09作者：翟萌耘Ralph

stable-diffusion-webui-directml

探索 Stable Diffusion 的 Web 界面，专为 AMD GPU 设计！一键安装，轻松运行。享受原生的文本转图像和图像转图像模式，外画、内补、色彩素描等创意功能。利用关注点控制模型注意力，实时预览生成过程。集成 GFPGAN、代码恢复工具等增强特性，支持自定义 Python 代码执行，打造个性化艺术作品。还能进行批量处理和无限生成选项，让你的创造力无限飞翔！

项目地址：https://gitcode.com/gh_mirrors/st/stable-diffusion-webui-directml

前言

对于使用AMD显卡的用户来说，部署Stable Diffusion这类AI绘画工具一直存在诸多挑战。本文将详细介绍如何在AMD显卡环境下正确配置Stable-Diffusion-Webui-DirectML项目，解决常见的运行错误，并提供性能优化建议。

环境准备

硬件要求

AMD显卡（推荐RX 570及以上型号）
至少8GB显存（16GB内存更佳）
Windows操作系统

软件依赖

Python 3.10.6
ROCm HIP SDK（根据显卡型号选择版本）
ZLUDA转换层

安装步骤

1. 基础环境配置

首先需要根据显卡型号安装对应版本的ROCm HIP SDK：

RX 570/580系列：HIP SDK 5.7
RX 5700/XT或6600/XT系列：HIP SDK 6.1

2. ZLUDA设置

ZLUDA作为CUDA到AMD的转换层，需要正确配置：

下载ZLUDA并解压到指定目录
将ZLUDA目录和HIP SDK的bin目录添加到系统PATH环境变量
复制必要的DLL文件到ZLUDA目录

3. 项目部署

克隆Stable-Diffusion-Webui-DirectML项目
创建Python虚拟环境
安装项目依赖（注意跳过torchaudio等可能冲突的组件）

常见问题解决

1. 运行时类型不匹配错误

错误信息："RuntimeError: Input type (float) and bias type (struct c10::Half) should be the same"

解决方案：

确保使用正确的启动参数：--use-zluda或--use-directml
清除venv文件夹重新安装依赖
检查显卡驱动和ROCm版本兼容性

2. 显存不足问题

8GB显存配置建议：

添加--medvram-sdxl参数
使用--skip-ort跳过onnxruntime
添加--no-half-vae参数

3. 模型加载失败

首次运行时使用较小的1.5基础模型（约2GB）
确保模型文件完整且放置在正确目录
对于SDXL等大型模型，需要16GB以上内存并设置足够大的页面文件

性能优化建议

启动参数优化：
- 根据显存大小选择--medvram或--lowvram
- 对于SDXL模型启用FP8模式
- 使用--skip-torch-cuda-test加速启动
模型选择：
- 初学者建议使用Dreamshaper等优化过的1.5基础模型
- 高级用户可尝试SDXL模型，但需注意硬件限制
稳定性提升：
- 首次运行时可能需要多次尝试才能成功
- 遇到连接错误时检查网络设置和安全软件
- 确保浏览器广告拦截器不会阻止WebUI

高级配置

对于希望使用Pony等特殊模型的用户，需要注意：

首次成功运行基础模型后再尝试加载特殊模型
确保系统有足够的内存和页面文件空间
可能需要调整模型加载参数和显存优化设置

结语

通过正确配置和优化，AMD显卡用户完全可以获得良好的Stable Diffusion使用体验。关键在于选择合适的ROCm版本、正确设置ZLUDA以及根据硬件条件调整运行参数。随着项目的持续发展，AMD显卡在AI绘画领域的支持将越来越完善。

stable-diffusion-webui-directml

探索 Stable Diffusion 的 Web 界面，专为 AMD GPU 设计！一键安装，轻松运行。享受原生的文本转图像和图像转图像模式，外画、内补、色彩素描等创意功能。利用关注点控制模型注意力，实时预览生成过程。集成 GFPGAN、代码恢复工具等增强特性，支持自定义 Python 代码执行，打造个性化艺术作品。还能进行批量处理和无限生成选项，让你的创造力无限飞翔！

项目地址：https://gitcode.com/gh_mirrors/st/stable-diffusion-webui-directml

登录后查看全文

最新内容推荐

VSdebugChkMatch.exe：专业PDB签名匹配工具全面解析与使用指南 Solidcam后处理文件下载与使用完全指南：提升CNC编程效率的必备资源中兴e读zedx.zed文档阅读器V4.11轻量版：专业通信设备文档阅读解决方案深入解析Windows内核模式驱动管理器：系统驱动管理的终极利器 PhysioNet医学研究数据库：临床数据分析与生物信号处理的权威资源指南 STM32到GD32项目移植完全指南：从兼容性到实战技巧 Python开发者的macOS终极指南：VSCode安装配置全攻略 PCDViewer-4.9.0-Ubuntu20.04：专业点云可视化与编辑工具全面解析基恩士LJ-X8000A开发版SDK样本程序全面指南 - 工业激光轮廓仪开发利器昆仑通态MCGS与台达VFD-M变频器通讯程序详解：工业自动化控制完美解决方案

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

ohos_react_native

React Native鸿蒙化仓库

flutter_flutter

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

本项目是CANN开源社区的核心管理仓库，包含社区的治理章程、治理组织、通用操作指引及流程规范等基础信息