MS-Swift项目中LoRA微调Qwen2.5-VL模型的问题分析与解决方案

2025-05-31 22:38:46作者：史锋燃Gardner

Use PEFT or Full-parameter to CPT/SFT/DPO/GRPO 600+ LLMs (Qwen3.6, DeepSeek-V4, GLM-5.1, InternLM3, Llama4, ...) and 300+ MLLMs (Qwen3-VL, Qwen3-Omni, InternVL3.5, Ovis2.5, GLM4.5v, Gemma4, Llava, Phi4, ...) (AAAI 2025).

项目地址：https://gitcode.com/GitHub_Trending/swift1/swift

在MS-Swift项目的最新版本中，用户尝试使用LoRA方法对Qwen2.5-VL-32B-Instruct模型进行微调时遇到了一个关键问题。这个问题表现为在准备模型阶段抛出异常，提示目标模块Qwen2_5_VLDecoderLayer不被支持。

问题背景

LoRA（Low-Rank Adaptation）是一种高效的大型语言模型微调方法，它通过在原始模型的权重矩阵上添加低秩分解的适配器来减少训练参数。在MS-Swift项目中，用户尝试结合LoRA对LLM部分进行微调，同时对视觉部分进行全参数微调。

错误分析

核心错误信息显示，PeFT库（Parameter-Efficient Fine-Tuning）无法识别Qwen2.5-VL模型的自定义DecoderLayer结构。具体错误指出，当前PeFT仅支持标准模块如torch.nn.Linear、torch.nn.Embedding等，而Qwen2_5_VLDecoderLayer作为自定义模块不在支持列表中。

技术细节

模块兼容性问题：PeFT库内部维护了一个支持的模块类型列表，当遇到不在列表中的模块类型时会抛出异常。
模型结构特殊性：Qwen2.5-VL模型使用了自定义的注意力机制Qwen2_5_VLFlashAttention2和Decoder层结构，这与标准Transformer结构有所不同。
版本变更影响：问题源于MS-Swift项目的一个PR（3879）对PeFT集成方式进行了修改，导致之前能正常工作的配置不再适用。

解决方案

项目维护者已经修复了这个问题。主要修复内容包括：

更新了LoRA配置的目标模块匹配规则，确保能正确识别Qwen2.5-VL模型的结构。
调整了PeFT集成方式，增强了对自定义模型结构的兼容性。

对于遇到类似问题的用户，建议：

更新到最新版本的MS-Swift代码库。
检查LoRA配置中的目标模块正则表达式是否与模型结构匹配。
确保PeFT版本与项目要求一致。

最佳实践

在进行多模态模型微调时：

仔细检查模型结构，特别是自定义模块的部分。
逐步测试微调配置，先验证小规模数据是否能正常运行。
关注项目更新日志，特别是涉及核心功能修改的部分。
对于复杂的微调场景（如LLM部分LoRA+视觉部分全参数），确保各组件版本兼容。

这个问题展示了在实际AI项目中，模型结构变化与训练框架之间的兼容性挑战，也体现了开源社区快速响应和修复问题的优势。

Use PEFT or Full-parameter to CPT/SFT/DPO/GRPO 600+ LLMs (Qwen3.6, DeepSeek-V4, GLM-5.1, InternLM3, Llama4, ...) and 300+ MLLMs (Qwen3-VL, Qwen3-Omni, InternVL3.5, Ovis2.5, GLM4.5v, Gemma4, Llava, Phi4, ...) (AAAI 2025).

项目地址：https://gitcode.com/GitHub_Trending/swift1/swift

登录后查看全文

项目优选

收起

deepin linux kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

昇腾LLM分布式训练框架

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started