PEFT项目中modules_to_save参数的深度解析与实践指南

2025-05-12 17:36:05作者：昌雅子Ethen

在参数高效微调(PEFT)技术中，modules_to_save是一个关键但容易被误解的配置参数。本文将从技术原理和工程实践两个维度，系统性地剖析该参数的设计意图、工作机制以及典型应用场景。

核心概念解析

modules_to_save参数专门用于指定需要完全微调（Full Fine-tuning）的模型模块。与target_modules（用于指定LoRA等PEFT方法应用的模块）形成互补关系：

当模块列入target_modules时，将应用参数高效的适配器方法
当模块列入modules_to_save时，该模块的所有参数都将参与常规梯度更新

技术实现上，PEFT框架会为modules_to_save中的模块创建可训练副本，原始参数则保持冻结状态。这种设计既保留了基础模型的稳定性，又允许关键模块进行充分调整。

典型应用场景

分类头微调
在迁移学习场景中，模型的最后一层（如lm_head）通常需要完全微调以适应新任务。此时应将分类头模块明确加入modules_to_save。
混合微调策略
当模型同时包含：
- 需要轻量级适配的大参数量模块（通过target_modules应用LoRA）
- 需要完整微调的小型功能模块（通过modules_to_save指定）这种组合策略能平衡训练效率和模型性能。

工程实践要点

参数保存机制
使用save_pretrained方法时，系统会自动保存：
- 所有PEFT适配器参数
- modules_to_save指定的完整模块参数无需额外配置。
训练恢复流程
通过PeftModel.from_pretrained加载时：
- is_trainable=True会保持modules_to_save的可训练状态
- 模块路径应通过.modules_to_save属性访问（常见误区是直接访问原模块）
参数冲突规避
严禁同一模块同时出现在target_modules和modules_to_save中，这会导致训练行为异常。工程实践中建议通过assert语句进行防御性检查。

高级技巧

对于需要动态调整训练策略的场景，可以通过以下代码控制训练状态：

# 临时冻结modules_to_save
for param in model.base_model.modules_to_save.parameters():
    param.requires_grad = False
    
# 恢复训练
for param in model.base_model.modules_to_save.parameters():
    param.requires_grad = True

理解并正确运用modules_to_save参数，能够帮助开发者构建更灵活高效的微调方案，在模型性能和训练成本之间取得最佳平衡。

peft

🤗 PEFT: State-of-the-art Parameter-Efficient Fine-Tuning.

项目地址：https://gitcode.com/gh_mirrors/pe/peft

登录后查看全文