Automatic项目中的ControlNet高分辨率修复问题解析

2025-06-03 12:41:48作者：吴年前Myrtle

问题背景

在Stable Diffusion生态系统中，ControlNet是一个强大的扩展功能，它允许用户通过输入控制图像（如人体姿态图、边缘检测图等）来精确控制生成图像的结构和构图。然而，在Automatic项目的开发过程中，发现了一个与高分辨率修复（hires pass）相关的重要问题。

当用户同时启用ControlNet和高分辨率修复功能时，系统在高分辨率修复阶段错误地将控制图像作为输入图像使用，而不是使用初始生成的图像。这导致最终输出的高分辨率图像实际上是对控制图像进行放大和修复的结果，而非对生成图像进行优化。

正常流程：在标准的txt2img流程中，系统应首先生成一个低分辨率图像，然后在高分辨率修复阶段对该图像进行放大和细节优化。
问题流程：当ControlNet启用时，系统错误地将控制图像直接传递到高分辨率修复阶段，导致：
- 初始生成阶段：正确使用文本提示和控制图像生成初步结果
- 高分辨率修复阶段：错误地使用控制图像而非生成图像作为输入
影响范围：该问题影响所有类型的ControlNet模型（如Openpose、Canny等），在使用非潜在空间高分辨率放大方法时尤为明显。

项目维护者已确认该问题并在最新提交中修复。修复的核心在于确保高分辨率修复阶段正确接收生成图像作为输入，而非控制图像。

这个问题的发现和解决对于保证ControlNet功能的正确性具有重要意义。它确保了：

该修复进一步提升了Automatic项目中ControlNet功能的可靠性和用户体验。

登录后查看全文