Stable Diffusion WebUI DirectML 中 ControlNet ONNX Runtime 问题的分析与解决

2025-07-04 03:27:23作者：魏侃纯Zoe

stable-diffusion-webui-directml

探索 Stable Diffusion 的 Web 界面，专为 AMD GPU 设计！一键安装，轻松运行。享受原生的文本转图像和图像转图像模式，外画、内补、色彩素描等创意功能。利用关注点控制模型注意力，实时预览生成过程。集成 GFPGAN、代码恢复工具等增强特性，支持自定义 Python 代码执行，打造个性化艺术作品。还能进行批量处理和无限生成选项，让你的创造力无限飞翔！

项目地址：https://gitcode.com/gh_mirrors/st/stable-diffusion-webui-directml

问题背景

在 Stable Diffusion WebUI DirectML 项目中，用户从 v1.9.3-amd-30-gee49046 升级到 v1.10.1-amd-2-g395ce8dc 版本后，发现 ControlNet 的 IP-Adapter 功能（特别是 ip-adapter-faceid-plusv2_sd15 模型）无法正常工作。错误日志显示与 ONNX Runtime 初始化相关的 CUDA 调用失败。

技术分析

错误根源

从错误日志中可以观察到几个关键点：

CUDNN_STATUS_INTERNAL_ERROR：这表明在尝试初始化 ONNX Runtime 时，CUDA 深度神经网络库(cuDNN)内部出现了问题。
cudnnSetStream 调用失败：具体是在设置 CUDA 流时发生的错误，这通常与 GPU 资源分配或兼容性问题有关。
ONNX Runtime 初始化异常：错误发生在 ONNX Runtime 尝试使用 CUDA 执行提供程序时。

深层原因

这个问题实际上与 AMD GPU 的特殊性有关。虽然项目名称为 DirectML，但用户实际上使用的是通过 Pinokio 安装的版本，而 Pinokio 并不完全支持 AMD WebUI 与 ZLUDA 的组合。ZLUDA 是一个能让 CUDA 代码在 AMD GPU 上运行的技术，比 DirectML 有更好的性能表现。

解决方案

推荐方案

使用专为 AMD GPU 优化的安装方式：
- 避免使用 Pinokio 安装，而是采用专门针对 AMD GPU 的安装指南
- 使用 ZLUDA 替代 DirectML，因为 ZLUDA 对支持的 AMD GPU 性能更好
跳过 ONNX Runtime 安装：
- 对于 ZLUDA 版本，ONNX Runtime 不是必需的组件
- 在安装时可以使用 --skip-ort 参数跳过 ONNX Runtime 的安装

版本兼容性建议

如果必须使用 ControlNet 的 IP-Adapter 功能，可以考虑暂时回退到 v1.9.3-amd-30-gee49046 版本
等待后续版本修复 ONNX Runtime 在 AMD GPU 上的兼容性问题

技术建议

对于 AMD GPU 用户，建议：

了解硬件限制：不是所有 AMD GPU 都完全支持所有深度学习工作流，特别是在使用某些特定的预处理模型时
选择正确的技术栈：根据 GPU 型号选择最适合的技术方案（ZLUDA 或 DirectML）
关注版本更新：AMD GPU 在深度学习领域的支持正在不断改进，及时关注项目更新可以避免许多兼容性问题

总结

这个问题本质上是由于 AMD GPU 在特定环境下的兼容性问题导致的。通过采用正确的安装方式和技术方案，可以避免此类问题并获得更好的性能表现。对于依赖 ControlNet IP-Adapter 功能的用户，建议遵循专门的 AMD GPU 安装指南，而不是使用通用的安装方法。

stable-diffusion-webui-directml

探索 Stable Diffusion 的 Web 界面，专为 AMD GPU 设计！一键安装，轻松运行。享受原生的文本转图像和图像转图像模式，外画、内补、色彩素描等创意功能。利用关注点控制模型注意力，实时预览生成过程。集成 GFPGAN、代码恢复工具等增强特性，支持自定义 Python 代码执行，打造个性化艺术作品。还能进行批量处理和无限生成选项，让你的创造力无限飞翔！

项目地址：https://gitcode.com/gh_mirrors/st/stable-diffusion-webui-directml

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

flutter_flutter

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理