Stable Diffusion WebUI DirectML项目中的ONNX/Olive集成问题分析与解决方案

2025-07-04 05:58:26作者：殷蕙予

问题背景

在AMD GPU环境下使用Stable Diffusion WebUI DirectML项目时，用户尝试通过ONNX Runtime和Olive优化来提升性能，但在图像生成过程中遇到了无法正常工作的问题。该问题主要表现为模型转换失败和路径缺失错误，导致最终无法生成图像。

问题现象分析

从用户报告和日志中可以观察到几个关键错误现象：

模型加载失败：系统报错"Torch not compiled with CUDA enabled"，表明在AMD环境下尝试使用CUDA相关功能导致失败。
ONNX路径问题：系统提示"Unable to locate file: 'models/ONNX/temp'"，表明ONNX相关目录结构缺失。
Olive配置验证失败：日志显示7个配置验证错误，包括系统配置、引擎和优化过程等多个方面的问题。
管道调用异常：最终错误显示"'OnnxRawPipeline' object is not callable"，表明ONNX管道未能正确初始化。

根本原因

经过深入分析，这些问题主要由以下几个因素导致：

目录结构不完整：项目在初始化时未能自动创建必要的ONNX工作目录（models/ONNX及其子目录cache和temp）。
Olive配置不兼容：当前的Olive模块配置与AMD执行环境存在兼容性问题，特别是在DmlExecutionProvider环境下。
依赖关系冲突：在安装过程中，不同版本的torch和onnxruntime-directml可能产生冲突。

解决方案

针对上述问题，我们推荐以下解决方案：

1. 手动创建ONNX工作目录

用户需要手动创建以下目录结构：

models/
└── ONNX/
    ├── cache/
    └── temp/

这个目录将用于存储ONNX模型转换过程中的临时文件和缓存数据。

2. 清理并重建Python环境

建议执行以下步骤确保干净的Python环境：

删除现有的venv目录
重新运行webui.bat安装脚本
确保使用正确的torch和onnxruntime-directml版本组合

3. 分步启用ONNX功能

不要一次性启用所有ONNX和Olive选项，建议按以下顺序逐步启用：

首先仅启用"Use ONNX Runtime"
选择正确的执行提供程序（DmlExecutionProvider）
确认基本功能正常后再尝试启用Olive优化

4. 配置验证

在启用任何优化前，建议：

检查ONNX Runtime版本（应≥1.17.3）
验证执行提供程序是否显示DmlExecutionProvider可用
确保模型文件路径正确且可访问

技术细节

ONNX在AMD GPU上的工作原理

ONNX Runtime通过DmlExecutionProvider为AMD GPU提供支持，它：

将PyTorch模型转换为ONNX格式
针对DirectML进行优化
利用AMD GPU的硬件加速能力

Olive优化的局限性

Olive是微软提供的模型优化工具，但目前：

对AMD GPU的支持仍处于实验阶段
配置验证较为严格
需要特定的目录结构和文件权限

最佳实践建议

环境隔离：为ONNX/Olive测试创建独立的Python环境
逐步验证：
- 先验证基础PyTorch功能
- 再测试ONNX Runtime基础功能
- 最后尝试Olive优化
日志分析：密切关注控制台输出，特别是：
- 模型转换成功信息
- 执行提供程序选择
- 路径访问错误
资源管理：确保有足够的磁盘空间（至少10GB空闲）用于模型转换

总结

在AMD GPU上使用Stable Diffusion WebUI DirectML项目的ONNX和Olive功能时，最关键的是确保正确的目录结构和执行环境。通过手动创建必要的ONNX工作目录、分步启用功能模块以及仔细监控日志输出，大多数用户能够成功解决集成问题。随着ONNX Runtime和Olive对AMD支持的不断完善，未来这类问题的发生频率有望显著降低。

stable-diffusion-webui-directml

Stable Diffusion web UI

项目地址：https://gitcode.com/gh_mirrors/st/stable-diffusion-webui-directml

登录后查看全文