SimpleTuner训练LoRA模型在ComfyUI中失效问题分析

2025-07-03 01:48:20作者：何将鹤

A general fine-tuning kit geared toward image/video/audio diffusion models.

项目地址：https://gitcode.com/GitHub_Trending/si/SimpleTuner

问题背景

在使用SimpleTuner工具训练Flux风格的LoRA模型时，许多用户反馈在ComfyUI中加载训练好的模型后效果不明显或完全失效。尽管训练过程顺利且没有报错，但在实际应用时无法观察到预期的风格变化。

技术分析

经过深入调查，发现这一问题主要涉及以下几个技术层面：

权重量化问题：ComfyUI在融合LoRA权重前会进行量化操作，这导致基础权重的改变几乎可以忽略不计。而在bf16精度下，权重能够被适当缩放，因此LoRA效果可以正常显现。
模型加载顺序：ComfyUI中模型的加载顺序会影响LoRA效果的应用。错误的加载顺序可能导致权重融合失败。
近期代码变更影响：某些近期的代码修改（虽已回滚）也造成了LoRA效果失效的问题，这属于临时性的兼容性问题。
全层训练设置：有用户反馈当设置训练所有LoRA层时会出现问题，而使用默认设置则可以正常工作。这表明某些训练配置可能与推理环境存在兼容性问题。

解决方案

针对上述问题，目前有以下几种解决方案：

调整训练参数：在训练时设置VALIDATION_STEPS=100等参数，可以更直观地观察到训练过程中模型的变化。
使用默认训练配置：避免修改LoRA层的训练设置，使用SimpleTuner的默认配置通常能获得更好的兼容性。
等待ComfyUI修复：由于核心问题在于ComfyUI的量化处理方式，最终需要等待其开发者修复权重融合逻辑。
临时解决方案：可以尝试移除某些针对quanto保存/加载问题的临时解决方案，这些方案虽然能创建LoRA，但可能会破坏关键参数。

技术建议

对于希望获得稳定LoRA效果的用户，建议：

优先在支持bf16精度的环境中使用训练好的LoRA模型
在ComfyUI中注意模型的加载顺序
保持SimpleTuner和ComfyUI的版本同步更新
训练时保留验证步骤，以便及时发现潜在问题

总结

SimpleTuner训练LoRA在ComfyUI中失效的问题是一个典型的训练-推理环境兼容性问题。理解其中的技术细节有助于开发者更好地使用这两个工具。目前建议用户在训练时保持默认配置，并关注后续的框架更新以获取更稳定的使用体验。

A general fine-tuning kit geared toward image/video/audio diffusion models.

项目地址：https://gitcode.com/GitHub_Trending/si/SimpleTuner

登录后查看全文

项目优选

收起

deepin linux kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

昇腾LLM分布式训练框架

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started