PEFT项目中LoRA模块保存机制的技术解析

2025-05-12 05:40:07作者：魏侃纯Zoe

在基于PEFT框架的模型微调实践中，我们发现当使用LoRA方法并指定modules_to_save参数时，模型参数会出现特殊的结构关系。本文将从技术实现层面深入剖析这一现象背后的设计原理。

核心现象观察

在Whisper模型上应用LoRA微调时，若指定encoder_prompt_sid为需要保存的模块，模型参数会同时出现两个相关但不同的参数路径：

base_model.model.model.encoder.encoder_prompt_sid.original_module.weight
model.model.encoder.encoder_prompt_sid.modules_to_save.default.weight

技术实现原理

1. 模块保存机制设计

PEFT框架采用了一种巧妙的参数管理策略。当开发者指定modules_to_save参数时，框架会为这些模块创建两个版本：

original_module：作为当前活动适配器的代理参数
modules_to_save.default：实际存储的模块参数

2. 动态参数映射机制

original_module.weight实际上是一个动态指针，其指向会根据当前激活的适配器状态自动切换：

默认情况下指向modules_to_save.default.weight
当切换适配器或停用适配器时，指针目标会相应改变

这种设计实现了参数版本的灵活管理，同时保持了模型结构的清晰性。

训练过程中的行为

在训练阶段：

modules_to_save.default.weight会接收梯度更新
original_module.weight作为代理会反映这些更新
参数同步是实时进行的，确保训练一致性

实际应用建议

对于开发者而言，需要注意：

在模型保存时，实际保存的是modules_to_save.default下的参数
加载模型时，original_module会自动重建正确的参数引用
多适配器场景下，这种设计能保证参数版本的隔离性

底层实现价值

这种双参数设计带来了三大优势：

版本控制：清晰区分基础参数和适配器参数
灵活性：支持动态适配器切换而不影响参数存储
兼容性：保持与原生模型结构的接口一致性

理解这一机制对于正确使用PEFT框架进行高效微调至关重要，特别是在需要保存额外模块参数的复杂微调场景中。

peft

🤗 PEFT: State-of-the-art Parameter-Efficient Fine-Tuning.

项目地址：https://gitcode.com/gh_mirrors/pe/peft

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

201

nop-entropy

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

leetcode

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.26 K

694