PEFT项目LoRA训练中的浮点精度问题分析与解决方案

2025-05-13 16:07:47作者：邬祺芯Juliet

问题背景

在PEFT（Parameter-Efficient Fine-Tuning）项目中使用LoRA（Low-Rank Adaptation）技术对Llama等大语言模型进行微调时，研究人员发现不同版本的PEFT库会显著影响训练结果。特别是在使用float16混合精度训练时，会出现损失值（loss）变为NaN或0的异常现象。

现象描述

主要观察到以下几种异常情况：

使用PEFT 0.9.0版本时，损失值立即变为NaN
使用PEFT 0.3.0版本时，初期训练正常，但约1000次迭代后开始出现NaN
在序列分类任务（TaskType.SEQ_CLS）中，score层的参数在反向传播后出现异常变化
使用float16精度时问题更易出现，而bfloat16则表现正常

技术分析

版本差异影响

通过对比PEFT不同版本的行为，发现0.6.2及以下版本表现稳定，而0.7.0及以上版本存在问题。深入分析表明，这与PEFT库内部的大规模重构有关，特别是对LoRA实现方式的修改影响了float16精度下的数值稳定性。

精度问题根源

问题的核心在于float16的有限数值范围（约5.96×10−8至65504）导致：

在反向传播过程中，小梯度值在float16下被截断为0
参数更新时出现数值下溢
特别影响score这类全连接层的训练稳定性

模块保存机制

当使用TaskType.SEQ_CLS时，PEFT会自动将score层加入modules_to_save进行全参数微调。这种混合训练模式（部分参数LoRA微调，部分参数全微调）在float16下更容易出现数值不稳定。

解决方案

版本选择建议

对于必须使用float16的场景，可考虑：

暂时使用PEFT 0.6.2版本
等待官方修复后的新版本发布

配置优化

针对序列分类任务的推荐配置：

peft_config = LoraConfig(
    task_type=TaskType.CAUSAL_LM,  # 避免自动添加score层
    inference_mode=False,
    r=8,
    lora_alpha=32,
    lora_dropout=0.1,
    target_modules=["q_proj", "v_proj"],
    modules_to_save=["score"]  # 显式控制需要全微调的层
)