Kohya-ss/sd-scripts项目中B-LoRA技术的实现与应用

2025-06-04 04:48:48作者：房伟宁

sd-scripts

项目地址：https://gitcode.com/gh_mirrors/sd/sd-scripts

技术背景

B-LoRA是一种创新的微调技术，专门针对Stable Diffusion模型进行风格与内容分离训练。这项技术通过在UNet架构的特定区块进行针对性训练，实现了对模型生成内容的精确控制，同时最小化对基础模型风格和构图能力的影响。

技术原理

B-LoRA的核心思想是通过限制LoRA训练的目标模块来实现特定能力的训练：

内容训练：主要针对UNet中的output_blocks.0.1模块
风格训练：主要针对UNet中的output_blocks.1.1模块
布局训练：可选择性地包含input_blocks.8.1模块

这种模块化训练方式相比传统LoRA训练具有明显优势：

生成内容更忠实于训练数据
对基础模型风格影响更小
训练参数更少，效率更高

在Kohya-ss/sd-scripts中的实现

虽然Kohya-ss/sd-scripts原生不支持B-LoRA，但可以通过LyCORIS扩展实现类似功能。以下是关键配置要点：

配置文件设置

enable_conv = false
unet_target_module = []
unet_target_name = ["^(?!.*(ff\\.net|proj)).*output_blocks\\.0\\.1\\..*$"]
text_encoder_target_module = ["CLIPAttention"]
text_encoder_target_name = []

这个配置通过正则表达式精确控制了训练目标模块，排除了不必要的投影层和前馈网络层。

训练参数建议

保持network_alpha等于网络维度
推荐使用AdamW优化器
设置network_train_unet_only以匹配B-LoRA默认行为
优化器参数建议：
- weight_decay=1e-04
- betas=(0.9,0.999)
- eps=1e-08

高级应用技巧

联合训练：可以同时训练内容和风格模块，后期通过工具筛选保留所需特性
权重调整：训练完成后可调整不同模块的权重比例
现有LoRA改造：可以从常规LoRA中提取特定模块特性

实际效果评估

经过优化配置后，B-LoRA在Kohya中表现：

权重可提升至1.0而不产生图像失真
训练效率显著提高
生成质量与原生B-LoRA实现相当

未来发展方向

布局模块的深入应用研究
多模块联合训练的优化策略
自动化模块选择算法的开发

这项技术为Stable Diffusion模型微调提供了新的可能性，特别是在需要精确控制生成内容特性的应用场景中。

sd-scripts

项目地址：https://gitcode.com/gh_mirrors/sd/sd-scripts

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

kernel