PEFT项目中LoRA适配器对冻结模块的影响分析

2025-05-12 06:18:07作者：戚魁泉Nursing

在基于PEFT（Parameter-Efficient Fine-Tuning）框架的模型微调实践中，开发者onehaitao提出了一个值得关注的技术现象：当使用LoRA（Low-Rank Adaptation）方法时，适配器模块会被自动添加到所有匹配目标模块名称的层上，包括那些已被显式冻结的模型组件。这一发现揭示了PEFT实现机制中一个容易被忽视的重要特性。

核心机制解析

PEFT框架中的LoRA实现采用模块名称匹配机制，其工作流程完全基于模块的字符串标识，而非参数的冻结状态。这意味着：

目标模块选择仅依赖target_modules参数配置
框架不会自动排除已被冻结的参数层
基础模型参数的冻结状态保持不受影响

典型应用场景

在实际项目中，这种特性可能引发预期外的行为。例如在视觉-语言多模态模型中：

冻结的ViT编码器仍可能被添加LoRA适配层
语言模型部分的同名模块会同步被修改
训练过程中仅LoRA参数会被更新，但模块结构已被改变

解决方案实践

开发者可通过以下技术手段实现精确控制：

显式指定目标模块列表
结合参数冻结状态进行模块筛选
利用正则表达式精确匹配模块路径

示例代码展示了如何智能筛选可训练模块：

freeze_params = [n for n,p in model.named_parameters() if not p.requires_grad]
trainable_targets = []
for name,_ in model.named_modules():
    if not check_target_module_exists(config, name): continue
    if not any(n.startswith(name) for n in freeze_params):
        trainable_targets.append(name)
config.target_modules = trainable_targets