Stable Diffusion WebUI DirectML 项目中的 ONNX/Olive 使用问题解析与解决方案

2025-07-04 18:46:14作者：董灵辛Dennis

stable-diffusion-webui-directml

探索 Stable Diffusion 的 Web 界面，专为 AMD GPU 设计！一键安装，轻松运行。享受原生的文本转图像和图像转图像模式，外画、内补、色彩素描等创意功能。利用关注点控制模型注意力，实时预览生成过程。集成 GFPGAN、代码恢复工具等增强特性，支持自定义 Python 代码执行，打造个性化艺术作品。还能进行批量处理和无限生成选项，让你的创造力无限飞翔！

项目地址：https://gitcode.com/gh_mirrors/st/stable-diffusion-webui-directml

问题背景

在使用 Stable Diffusion WebUI DirectML 项目时，部分用户遇到了无法通过 ONNX Runtime 和 Olive 优化生成图像的问题。具体表现为当启用 ONNX Runtime 并选择 DmlExecutionProvider 执行器后，系统抛出"OnnxRawPipeline is not callable"的错误提示。

问题分析

这个问题主要出现在2024年2月项目重构之后，影响了使用 Olive 优化模型进行图像生成的功能。从技术层面来看，这是由于：

项目重构后部分接口调用方式发生了变化
运行环境依赖库版本不兼容
缓存数据可能造成干扰

解决方案

经过项目维护者的确认，以下是完整的解决方案：

首先确保拉取项目最新代码
清理并重新配置 Python 虚拟环境
安装正确版本的依赖库

具体操作步骤如下：

# 激活虚拟环境
.\venv\Scripts\activate

# 卸载现有相关库
pip uninstall torch torchvision torch-directml onnxruntime onnxruntime-directml -y

# 安装稳定版本的 PyTorch 和 ONNX Runtime
pip install torch torchvision onnxruntime

# 安装 DirectML 版本的 ONNX Runtime
pip install onnxruntime-directml

启动 WebUI 时使用以下参数：

--use-cpu-torch

技术原理

这个解决方案的核心在于：

使用 --use-cpu-torch 参数确保 PyTorch 运行在 CPU 模式，避免与 ONNX Runtime 产生冲突
安装标准版 ONNX Runtime 作为基础，再安装 DirectML 版本提供 GPU 加速支持
清理旧版本库和缓存确保环境纯净

注意事项

不需要再使用 --use-directml 参数
如果问题仍然存在，建议清理以下缓存目录：
- 虚拟环境缓存
- 用户目录下的 .cache 文件夹
确保所有操作在虚拟环境中进行

性能对比

成功解决问题后，用户可以获得显著的性能提升：

使用 Olive 优化后：约 8 it/s
未使用优化前：约 1.15 it/s

这个解决方案已经过多个用户验证有效，能够恢复 ONNX Runtime 和 Olive 优化功能，显著提升图像生成效率。

stable-diffusion-webui-directml

探索 Stable Diffusion 的 Web 界面，专为 AMD GPU 设计！一键安装，轻松运行。享受原生的文本转图像和图像转图像模式，外画、内补、色彩素描等创意功能。利用关注点控制模型注意力，实时预览生成过程。集成 GFPGAN、代码恢复工具等增强特性，支持自定义 Python 代码执行，打造个性化艺术作品。还能进行批量处理和无限生成选项，让你的创造力无限飞翔！

项目地址：https://gitcode.com/gh_mirrors/st/stable-diffusion-webui-directml

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

flutter_flutter

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

ohos_react_native

React Native鸿蒙化仓库

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。