Qwen-VL项目中LoRA训练与全参数保存的技术实现

2025-06-05 09:44:40作者：龚格成

背景介绍

在大型语言模型微调过程中，LoRA（Low-Rank Adaptation）是一种高效且节省资源的参数微调方法。它通过在原始模型参数旁添加低秩矩阵来实现微调，而不改变原始模型参数。然而，在某些应用场景下，开发者可能希望在LoRA训练的同时保留完整模型的参数更新能力。

LoRA训练的基本原理

LoRA技术通过在Transformer层的注意力机制中引入两个低秩矩阵（通常记为A和B）来实现微调。在标准实现中，训练完成后只保存这些低秩适配器的权重，原始模型参数保持不变。这种方法的优势在于：

显著减少需要训练的参数数量
便于模型切换和部署
节省存储空间

全参数保存的需求场景

在某些特殊情况下，开发者可能需要：

同时微调LoRA适配器和部分原始模型参数
保留完整的模型状态而不仅仅是适配器
实现更灵活的模型组合和迁移

技术实现方案

方案一：手动参数保存与加载

通过遍历模型的所有可训练参数，开发者可以手动保存这些参数到文件：

to_save = {
    f"{name}.{param_name}": param.detach().cpu() 
    for name, module in model.named_modules() 
    for param_name, param in module.named_parameters() 
    if param.requires_grad
}
torch.save(to_save, 'output_dir/lora_adapter_model.pth')

加载时则需要先加载基础模型，再加载保存的参数：

saved_parameters = torch.load('output_dir/lora_adapter_model.pth')
model.load_state_dict(saved_parameters, strict=False)

这种方法提供了最大的灵活性，但需要开发者对模型结构有深入了解。

方案二：使用modules_to_save参数

Qwen-VL项目提供了更简便的modules_to_save参数来实现这一需求。通过指定需要额外保存的模块，可以在LoRA训练的同时更新这些模块的参数：

# 示例配置
modules_to_save = [
    "transformer.wte",  # 词嵌入层
    "lm_head"          # 语言模型头部
]

其中：

transformer.wte代表词嵌入层（Word Token Embeddings）
lm_head代表语言模型的任务特定头部（Language Model Head）

关键模块解析

词嵌入层（wte）：负责将输入token转换为向量表示，对模型理解输入内容至关重要。
语言模型头部（lm_head）：将隐藏状态转换为词汇表上的概率分布，直接影响模型的生成质量。

通过微调这些关键模块，可以在保持LoRA高效性的同时，获得更精细的控制能力。

实际应用建议

对于大多数场景，标准LoRA训练已经足够
当需要调整模型的基础表示能力时，可考虑添加词嵌入层
当生成质量需要特别优化时，可包含语言模型头部
全参数保存会显著增加存储需求，应谨慎使用

总结

Qwen-VL项目提供了灵活的参数微调方案，开发者可以根据具体需求选择纯LoRA训练或结合部分原始参数更新的混合模式。通过合理配置modules_to_save参数，可以在资源消耗和模型性能之间取得平衡。

Qwen-VL

The official repo of Qwen-VL (通义千问-VL) chat & pretrained large vision language model proposed by Alibaba Cloud.

项目地址：https://gitcode.com/gh_mirrors/qw/Qwen-VL

登录后查看全文

项目优选

收起

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

Rust

591

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件，通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求，让密码技术应用更简单，同时探索后量子等先进算法创新实践，构建密码前沿技术底座！

1.09 K

567

cherry-studio

🍒 Cherry Studio 是一款支持多个 LLM 提供商的桌面客户端

TypeScript

1.43 K

116