SD.Next项目中使用DirectML后端时GPU加速问题的分析与解决

2025-06-05 01:28:59作者：贡沫苏Truman

问题背景

在SD.Next项目中，部分AMD显卡用户在尝试使用DirectML后端进行GPU加速时遇到了问题。主要症状表现为系统始终使用CPU进行计算，无法切换到GPU加速模式，或者在启用medvram参数时出现"Torch not compiled with CUDA enabled"错误。

问题分析

通过对多个用户报告的日志分析，我们发现该问题主要由以下几个因素导致：

Torch版本冲突：系统中存在多个Torch安装版本，导致Python优先加载了CPU版本的Torch而非DirectML版本。
安装参数缺失：首次运行时未正确使用"--use-directml"参数，导致安装了错误的Torch版本。
驱动兼容性问题：部分AMD显卡驱动版本与DirectML存在兼容性问题。
medvram参数冲突：在DirectML后端下使用medvram参数时会出现兼容性问题。

解决方案

1. 确保正确的安装流程

首次安装或重新安装时，必须使用以下命令：

webui.bat --use-directml --reinstall

这将确保安装正确的torch-directml包，而非CPU版本的Torch。

2. 检查系统环境

确保：

Python版本为3.10（DirectML目前对3.11+支持不完善）
系统中没有全局安装的Torch包（可能干扰venv中的正确版本）
使用pip list检查venv中安装的包，确保torch-directml存在且版本正确

3. AMD驱动选择

虽然最新版Adrenalin驱动在大多数情况下工作正常，但部分用户反馈切换到AMD PRO驱动可以解决兼容性问题。这可能是由于PRO驱动对专业计算场景有更好的优化。

4. 避免medvram参数

目前发现medvram参数与DirectML后端存在兼容性问题。建议：

对于8GB显存显卡，可以尝试不使用medvram
或者使用--lowvram参数（虽然会显示错误但能完成生成）

技术细节

torch-directml的工作原理是将PyTorch操作映射到DirectML API，再由DirectML调用AMD显卡的计算能力。这一过程不依赖CUDA，因此当出现"Torch not compiled with CUDA enabled"错误时，实际表明的是PyTorch未能正确加载DirectML后端。

日志中反复出现的"Installing package: torch-directml"信息是正常现象，这是SD.Next的依赖检查机制在验证torch-directml的安装状态。