PEFT项目中LoRA模型的Wise-FT方法实现与优化

2025-05-12 03:19:08作者：卓炯娓

在大型语言模型微调领域，LoRA（Low-Rank Adaptation）技术因其参数高效性而广受欢迎。近期，PEFT项目团队针对LoRA模型实现了一项重要改进——Wise-FT方法，这种方法能够有效平衡基础模型的零样本能力和微调后的任务特定性能。

Wise-FT方法原理

Wise-FT的核心思想是通过权重插值来平衡模型性能。其数学表达式为： W_wise = (1-α) * W_base + α * W_ft 其中α∈[0,1]为调节参数。当α=0时完全保留基础模型能力，α=1时则完全采用微调后的模型参数。

对于LoRA模型，由于W_ft = W_base + W_delta，公式可简化为： W_wise = W_base + α * W_delta 这种简化形式使得实现更加高效。

技术实现方案

PEFT项目团队提供了多种实现方案：

上下文管理器方案：通过set_adapter_scale方法临时调整缩放因子，确保原始值能够自动恢复。这种方法特别适合需要快速切换不同α值的实验场景。
权重合并方案：在模型合并时直接应用Wise-FT，适合需要持久化调整后模型的场景。
DoRA兼容方案：针对使用DoRA（Decomposed Low-Rank Adaptation）的模型，提供了专门的实现考虑。

实际应用效果

在实际应用中，Wise-FT方法表现出色：

在Amazon KDD Cup 2024比赛中，采用此方法的团队在5个赛道上均取得领先
性能提升最高达1.5%
特别适用于训练数据和测试数据存在分布偏移的场景

技术细节与优化

实现过程中，团队特别关注了以下技术细节：

设备兼容性：针对不同计算设备（CPU、CUDA、MPS）进行了专门优化
内存效率：避免创建不必要的权重副本
数值稳定性：确保插值过程中的数值精度
API设计：提供简洁易用的接口，方便研究人员使用

未来发展方向

PEFT团队计划进一步完善Wise-FT实现：

增强对DoRA模型的全面支持
优化多设备下的执行效率
提供更丰富的应用示例
探索与其他参数高效微调技术的结合

这项改进为研究人员提供了更灵活的工具，特别是在需要平衡模型通用能力和特定任务表现的场景下，展现出显著优势。随着进一步优化，Wise-FT有望成为LoRA微调的标准技术之一。

peft

🤗 PEFT: State-of-the-art Parameter-Efficient Fine-Tuning.

项目地址：https://gitcode.com/gh_mirrors/pe/peft

登录后查看全文

项目优选

收起

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力