在kohya-ss/sd-scripts中支持SDXL v-prediction模型的LoRA训练

2025-06-04 18:06:16作者：宣海椒Queenly

近期，kohya-ss/sd-scripts项目迎来了一个重要更新，支持了基于v-prediction的SDXL模型进行LoRA训练。这一改进为AI图像生成领域的研究者和开发者提供了更强大的工具选择。

v-prediction是一种在扩散模型中使用的预测方式，与传统的ε-prediction有所不同。它直接预测噪声的方差，在某些情况下能够生成质量更高的图像。NoobAI_XL等基于v-prediction的SDXL模型已经展示了出色的性能表现。

在使用kohya-ss/sd-scripts进行LoRA训练时，需要注意以下几点关键技术细节：

必须使用项目的dev分支，该分支已经实现了对v-prediction SDXL模型的支持
如果使用的模型（如NoobAI_XL）假设了零终端信噪比(zero terminal SNR)，需要在训练命令中添加--zero_terminal_snr参数
训练完成后，生成的LoRA模型可以正常用于图像生成而不会出现空白图像的问题

这一更新为模型微调提供了更多可能性，用户现在可以在优秀的v-prediction基础模型上进行进一步的个性化训练，而不再局限于传统的ε-prediction模型。对于追求更高图像质量的研究者和开发者来说，这无疑是一个重要的进步。

建议用户在尝试此功能时，先从小规模训练开始，验证模型效果后再进行大规模训练。同时，不同的v-prediction基础模型可能需要调整不同的训练参数，以获得最佳效果。

登录后查看全文