在AMD RX7800XT显卡上优化Stable Diffusion WebUI运行指南

2025-07-04 09:45:23作者：江焘钦

背景介绍

Stable Diffusion WebUI作为当前流行的AI图像生成工具，通常推荐在NVIDIA显卡上运行。然而，许多AMD显卡用户也希望能够充分利用自己的硬件资源。本文将详细介绍如何在AMD RX7800XT显卡上优化运行Stable Diffusion WebUI，解决常见问题并提供性能优化建议。

配置方案

针对AMD RX7800XT显卡，有两种主要的配置方案可供选择：

方案一：使用DirectML后端

@echo off
set COMMANDLINE_ARGS=--skip-torch-cuda-test --use-directml --skip-python-version-check --api --no-half
call webui.bat

方案二：高级优化配置

@echo off
set COMMANDLINE_ARGS=--use-directml --skip-torch-cuda-test --skip-python-version-check --api --no-half --medvram --precision full --no-half-vae --opt-split-attention-invokeai --always-batch-cond-uncond --opt-sub-quad-attention --sub-quad-q-chunk-size 512 --sub-quad-kv-chunk-size 512 --sub-quad-chunk-threshold 80 --disable-nan-check --upcast-sampling
set SAFETENSORS_FAST_GPU=1
call webui.bat

技术要点解析

后端选择：AMD显卡用户可以选择DirectML或Zluda作为计算后端。需要注意的是，两者不能同时启用，否则会导致冲突。
内存优化参数：
- --medvram：启用中等显存优化模式
- --opt-split-attention-invokeai：优化注意力机制的内存使用
- --always-batch-cond-uncond：强制批量处理条件和非条件计算
计算精度控制：
- --no-half：禁用半精度计算
- --precision full：使用完整精度
- --no-half-vae：VAE部分禁用半精度
性能优化参数：
- --opt-sub-quad-attention：启用子二次注意力优化
- 相关chunk-size参数调整内存分块策略

常见问题与解决方案

显存不足问题：
- 使用--medvram或--lowvram参数
- 降低生成分辨率
- 使用更小的模型
VAE处理速度慢：
- SDXL的VAE分辨率是SD1.5的4倍，这会导致处理速度显著下降
- 考虑使用--no-half-vae确保稳定性
计算精度问题：
- AMD显卡对半精度计算支持不如NVIDIA完善
- 建议使用完整精度(--precision full)以确保稳定性

性能优化建议

模型选择：优先选择专为AMD显卡优化或经过验证能在AMD显卡上良好运行的模型。
参数调优：根据具体显存大小调整chunk-size相关参数，找到最佳平衡点。
系统优化：确保显卡驱动为最新版本，关闭不必要的后台程序释放系统资源。
监控工具：使用GPU监控工具观察显存使用情况，据此调整参数。

通过以上配置和优化，AMD RX7800XT显卡用户可以在Stable Diffusion WebUI上获得相对稳定的运行体验。虽然性能可能不及同级别NVIDIA显卡，但通过合理的参数调整，仍然能够完成大多数图像生成任务。

登录后查看全文

项目优选

收起

deepin linux kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

昇腾LLM分布式训练框架

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。