SD.Next项目中使用ZLUDA在AMD GFX906显卡上的问题分析与解决方案

2025-06-05 21:19:28作者：房伟宁

SD.Next是一款强大的扩散模型工具箱，集成了先进的特性与多样的模型支持，为创意生成带来无限可能。该开源项目拥抱多样性，兼容包括Stable Diffusion、LCM、Kandinsky等在内的众多模型，并且支持文本到图像、图像处理乃至视频转换的控制网路技术。其亮点在于跨平台运行能力，覆盖Windows、Linux、MacOS及不同GPU厂商，自动调优确保最佳性能。现代化UI、内置队列管理与自动化更新机制让每一次创作都流畅高效。无论是专业艺术家还是AI爱好者，SD.Next都是探索人工智能艺术不可多得的利器。加入这个活跃的社区，解锁创意的新纪元。

项目地址：https://gitcode.com/GitHub_Trending/au/automatic

背景介绍

SD.Next是一个基于Stable Diffusion的AI图像生成项目，它支持多种硬件加速方案。对于AMD显卡用户而言，ZLUDA是一个能够将CUDA代码转换为在AMD显卡上运行的兼容层工具，理论上可以让AMD显卡获得类似NVIDIA CUDA的运行体验。

问题现象

在Windows 10系统上使用AMD Radeon Pro VII显卡(GFX906架构)运行SD.Next项目时，当启用ZLUDA支持后，生成的图像会出现混乱失真的情况。值得注意的是，系统日志中并未报告任何错误信息，这使得问题排查更加困难。

环境配置

操作系统：Windows 10 22H2
显卡型号：AMD Radeon Pro VII (GFX906架构)
软件版本：
- SD.Next最新开发版
- HIP SDK 5.7.1
- ZLUDA 3.5
模型：基于SD 1.5的Anything V5模型

问题分析

通过对比测试发现：

使用DirectML后端时，GFX906显卡能够正常生成图像
使用ZLUDA但强制使用CPU时，也能获得正确结果
只有在ZLUDA+GFX906组合下才会出现图像混乱

这表明问题很可能出在ZLUDA对GFX906架构的支持上，而非SD.Next项目本身。日志显示系统正确识别了GFX906设备，但可能缺少针对该架构优化的内核二进制文件。

解决方案探索

1. 使用预编译的ROCm库

尝试使用社区提供的ROCmLibs库替换官方ROCm库，这个库旨在支持更多GFX架构，包括GFX906。虽然测试中未能解决问题，但这仍是一个值得尝试的方向。

2. 自行编译内核二进制

对于高级用户，可以考虑自行编译针对GFX906架构优化的内核二进制文件。这需要：

熟悉ROCm工具链
了解AMD GPU架构特性
具备一定的编译经验

编译过程涉及：

设置正确的编译环境
针对特定GFX架构进行优化
生成兼容的内核二进制文件

3. 社区协作开发

SD.Next社区正在积极开发支持更多GFX架构的内核二进制文件。用户可以关注社区动态，特别是针对GFX906架构的支持进展。

技术建议

对于GFX906显卡用户，目前建议暂时使用DirectML后端
关注ZLUDA和ROCm对GFX906架构支持的更新
考虑参与社区协作，共同完善对GFX906的支持
在测试新方案时，建议做好环境备份

总结

AMD显卡在AI计算领域的支持仍在不断完善中。GFX906架构在SD.Next项目中通过ZLUDA运行时出现的问题，反映了特定架构支持方面的挑战。随着社区的努力和技术的进步，这些问题有望得到解决。对于遇到类似问题的用户，建议保持耐心，关注官方和社区的更新动态。

automatic

项目地址：https://gitcode.com/GitHub_Trending/au/automatic

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

nop-entropy

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

349

200

pytorch

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理