PEFT项目：如何修改已加载LoRA模型的modules_to_save配置

2025-05-12 10:26:20作者：裘旻烁

在基于PEFT（Parameter-Efficient Fine-Tuning）框架进行模型微调时，开发者经常会遇到需要修改已训练LoRA模型配置的情况。本文将以Whisper模型为例，深入探讨如何安全有效地调整已加载LoRA模型的modules_to_save参数设置。

背景与问题场景

当使用LoRA技术微调Whisper模型后，开发者可能需要对模型架构进行扩展，例如添加新的网络层。此时，需要将这些新增层纳入modules_to_save配置中，以确保它们的参数能够被正确保存到adapter_model.safetensors文件中。

常见误区是尝试在模型加载后直接修改peft_config中的modules_to_save属性，这种做法实际上不会生效，因为模型参数结构在加载时就已经确定。

解决方案详解

方法一：直接修改配置文件

最直接的方式是手动编辑checkpoint目录下的adapter_config.json文件：

定位到保存的LoRA模型checkpoint目录
打开adapter_config.json文件
在modules_to_save数组中添加需要保存的新层名称
保存修改后的配置文件
正常加载模型

这种方法简单直接，适合快速实验和调试场景。

方法二：编程式配置修改（推荐）

更规范的解决方案是通过代码流程实现：

首先加载PeftConfig

peft_config = PeftConfig.from_pretrained(checkpoint_path)

修改配置对象的modules_to_save属性

peft_config.modules_to_save.extend(["new_layer1", "new_layer2"])

使用修改后的配置加载模型

model = PeftModel.from_pretrained(base_model, checkpoint_path, config=peft_config)

这种方法更具可编程性，适合集成到自动化训练流程中。

技术原理深入

PEFT框架在加载LoRA模型时，会根据配置中的modules_to_save参数决定哪些层需要被特殊处理。这些层会被标记为可训练参数，并且它们的状态会被单独保存。如果在模型加载完成后才修改配置，框架无法重新初始化这些层的参数处理逻辑。

最佳实践建议

在模型架构变更时，优先考虑通过配置修改而非事后调整
对于生产环境，推荐使用方法二的编程式配置
修改配置后，建议进行完整性检查，确认新增层已被正确纳入训练
对于复杂架构变更，考虑创建全新的配置而非修改现有配置

通过遵循这些实践，开发者可以更灵活地利用PEFT框架进行模型微调和扩展，同时保证训练过程的稳定性和可复现性。

peft

🤗 PEFT: State-of-the-art Parameter-Efficient Fine-Tuning.

项目地址：https://gitcode.com/gh_mirrors/pe/peft

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

MindSpeed-MM

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。