Automatic项目中的AMD GPU多卡支持问题分析

2025-06-03 05:01:22作者：秋泉律Samson

SD.Next是一款强大的扩散模型工具箱，集成了先进的特性与多样的模型支持，为创意生成带来无限可能。该开源项目拥抱多样性，兼容包括Stable Diffusion、LCM、Kandinsky等在内的众多模型，并且支持文本到图像、图像处理乃至视频转换的控制网路技术。其亮点在于跨平台运行能力，覆盖Windows、Linux、MacOS及不同GPU厂商，自动调优确保最佳性能。现代化UI、内置队列管理与自动化更新机制让每一次创作都流畅高效。无论是专业艺术家还是AI爱好者，SD.Next都是探索人工智能艺术不可多得的利器。加入这个活跃的社区，解锁创意的新纪元。

项目地址：https://gitcode.com/GitHub_Trending/au/automatic

问题背景

在Automatic项目的实际使用中，用户尝试在AMD GPU环境下使用多张显卡（MI50 gfx906）进行加速时遇到了技术障碍。当用户通过命令行参数--device-id="0,1,2,3"指定多张显卡时，系统抛出"RuntimeError: Invalid device string: 'cuda:0,1,2,3'"错误，导致无法正常启动。

技术分析

1. 根本原因

根据项目协作者的确认，当前Automatic项目在设计上仅支持单设备运行。唯一能够支持多设备并行计算的只有OpenVINO后端。这与NVIDIA CUDA环境下的多卡并行机制有本质区别。

2. AMD ROCm环境特性

在AMD ROCm环境下，虽然可以通过HIP_VISIBLE_DEVICES环境变量指定多张显卡，但项目本身的架构限制使得这一功能无法直接使用。这与以下技术因素有关：

项目底层使用的是PyTorch ROCm版本
PyTorch对AMD多卡的支持方式与CUDA不同
当前项目未实现AMD多卡的负载均衡机制

3. 错误机制解析

当用户尝试指定多个设备ID时，系统会尝试将这些ID组合成一个设备字符串"cuda:0,1,2,3"，但PyTorch ROCm后端并不支持这种格式的设备标识。正确的AMD设备指定方式应该是单独使用一个设备ID。

解决方案建议

对于希望在AMD环境下使用多张显卡的用户，可以考虑以下替代方案：

单卡运行：目前最稳定的方案是仅使用一张显卡
OpenVINO后端：如果模型支持，可以尝试切换到OpenVINO后端
分批处理：通过脚本控制，将任务分批分配到不同显卡上运行

未来改进方向

从技术架构角度看，要实现AMD多卡支持需要：

修改设备管理模块，支持ROCm多设备枚举
实现AMD特定的多卡内存管理和任务分配机制
增加对HIP多设备上下文的支持
可能需要等待PyTorch对ROCm多卡支持更加完善

总结

目前Automatic项目在AMD GPU环境下对多卡支持存在限制，这是由项目架构和ROCm生态现状共同决定的。用户在使用AMD显卡时应当注意这一限制，并根据实际需求选择合适的运行方案。随着ROCm生态的不断完善，未来有望实现更完善的多卡支持。

SD.Next是一款强大的扩散模型工具箱，集成了先进的特性与多样的模型支持，为创意生成带来无限可能。该开源项目拥抱多样性，兼容包括Stable Diffusion、LCM、Kandinsky等在内的众多模型，并且支持文本到图像、图像处理乃至视频转换的控制网路技术。其亮点在于跨平台运行能力，覆盖Windows、Linux、MacOS及不同GPU厂商，自动调优确保最佳性能。现代化UI、内置队列管理与自动化更新机制让每一次创作都流畅高效。无论是专业艺术家还是AI爱好者，SD.Next都是探索人工智能艺术不可多得的利器。加入这个活跃的社区，解锁创意的新纪元。

项目地址：https://gitcode.com/GitHub_Trending/au/automatic

登录后查看全文

最新内容推荐

OMNeT++中文使用手册：网络仿真的终极指南与实用教程全球GEOJSON地理数据资源下载指南 - 高效获取地理空间数据的完整解决方案 LabVIEW串口通信开发全攻略：从入门到精通的完整解决方案 PCDViewer-4.9.0-Ubuntu20.04：专业点云可视化与编辑工具全面解析基于Matlab的等几何分析IGA软件包：工程计算与几何建模的完美融合谷歌浏览器跨域插件Allow-Control-Allow-Origin：前端开发调试必备神器 Adobe Acrobat XI Pro PDF拼版插件：提升排版效率的专业利器 Windows版Redis 5.0.14下载资源：高效内存数据库的完美Windows解决方案 TextAnimator for Unity：打造专业级文字动画效果的终极解决方案 PANTONE潘通AI色板库：设计师必备的色彩管理利器

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

flutter_flutter

一个用于服务器应用开发的综合工具库。 - 零配置文件 - 环境变量和命令行参数配置 - 约定优于配置 - 深刻利用仓颉语言特性 - 只需要开发动态链接库，fboot负责加载、初始化并运行。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

cangjie_runtime

仓颉编程语言运行时与标准库。

Cangjie-Examples

本仓将收集和展示高质量的仓颉示例代码，欢迎大家投稿，让全世界看到您的妙趣设计，也让更多人通过您的编码理解和喜爱仓颉语言。

旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件，通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求，让密码技术应用更简单，同时探索后量子等先进算法创新实践，构建密码前沿技术底座！

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

🍒 Cherry Studio 是一款支持多个 LLM 提供商的桌面客户端