LyCORIS项目中DoRA权重分解轴差异的技术解析

2025-07-02 08:13:01作者：龚格成

Lora beYond Conventional methods, Other Rank adaptation Implementations for Stable diffusion.

项目地址：https://gitcode.com/gh_mirrors/ly/LyCORIS

背景介绍

在深度学习模型微调领域，LoRA（Low-Rank Adaptation）及其变种DoRA（Weight-Decomposed Low-Rank Adaptation）是两种重要的参数高效微调方法。近期在LyCORIS项目中发现其DoRA实现与PEFT库中的实现存在一个关键差异：权重分解的轴向选择不同。

问题本质

DoRA方法的核心思想是将预训练权重矩阵W分解为幅度(m)和方向(V)两部分：W = m·V/||V||_F。其中关键的技术细节在于幅度向量m的维度选择。

在LyCORIS实现中：

对于一个Linear(784, 2048)层，DoRA幅度向量形状为[1, 784]（输入维度）
而在PEFT实现中，相同层的幅度向量形状为[2048]（输出维度）

技术分析

根据原始DoRA论文的数学表示：

权重矩阵W的维度为d×k（输出×输入）
LoRA更新项BA中，B维度为d×r，A维度为r×k
论文中的分解操作似乎针对输入维度k

然而，从作者参考实现代码来看：

幅度向量确实采用了输出维度d
PEFT实现与参考代码一致

实现差异的影响

这种轴向选择的差异会导致：

模型参数空间不同
训练动态可能有所变化
检查点文件不兼容

虽然理论上两种实现都可能有效，但会带来以下实际问题：

无法在LyCORIS和PEFT之间直接迁移DoRA模型
社区可能出现混淆

解决方案与建议

LyCORIS项目已采取以下措施：

保持现有实现作为默认选项（输入维度分解）
在3.1.1版本新增wd_on_output参数，允许用户选择输出维度分解
确保向后兼容性

对于使用者建议：

明确所用库的DoRA实现方式
训练和推理使用相同实现
需要迁移模型时注意维度转换

技术思考

这种实现差异反映了深度学习实践中常见的现象：

论文数学描述与实际代码实现可能存在差异
不同框架对矩阵维度的处理约定不同
早期实现决策会影响长期兼容性

从优化角度看，两种分解方式各有特点：

输入维度分解可能更关注特征选择
输出维度分解可能更关注神经元激活模式

结论

LyCORIS与PEFT在DoRA实现上的轴向差异是一个值得注意的技术细节。虽然两种实现都可能有效，但使用者需要了解这一差异以避免兼容性问题。LyCORIS项目通过提供配置选项来支持两种模式，既保持了兼容性又提供了灵活性。这一案例也提醒我们，在复现论文方法时需要仔细核对理论描述与参考实现。

Lora beYond Conventional methods, Other Rank adaptation Implementations for Stable diffusion.

项目地址：https://gitcode.com/gh_mirrors/ly/LyCORIS

登录后查看全文

最新内容推荐

Python开发者的macOS终极指南：VSCode安装配置全攻略基于Matlab的等几何分析IGA软件包：工程计算与几何建模的完美融合深入解析Windows内核模式驱动管理器：系统驱动管理的终极利器基恩士LJ-X8000A开发版SDK样本程序全面指南 - 工业激光轮廓仪开发利器咖啡豆识别数据集：AI目标检测在咖啡质量控制中的革命性应用 STM32到GD32项目移植完全指南：从兼容性到实战技巧瀚高迁移工具migration-4.1.4：企业级数据库迁移的智能解决方案昆仑通态MCGS与台达VFD-M变频器通讯程序详解：工业自动化控制完美解决方案 PADS元器件位号居中脚本：提升PCB设计效率的自动化利器 MQTT客户端软件源代码：物联网开发的强大工具与最佳实践指南

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

flutter_flutter

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

ohos_react_native

React Native鸿蒙化仓库

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

cangjie_compiler

仓颉编译器源码及 cjdb 调试工具。