LLaMA-Factory项目中Qwen2.5-VL模型全参数微调的内存优化实践

2025-05-01 01:42:38作者：鲍丁臣Ursa

在LLaMA-Factory项目的最新版本中，开发者们发现了一个关于Qwen2.5-VL多模态模型全参数微调时的内存管理问题。这个问题特别出现在启用了unsloth_gc和liger_kernel优化选项的情况下。

当用户尝试对Qwen2.5-VL模型进行全参数微调（finetuning_type设置为full）且不冻结视觉塔（freeze_vision_tower设为false）时，系统会抛出"too many values to unpack (expect 1)"的错误。这个错误源于checkpointing.py文件中的内存管理代码不一致。

具体来说，在checkpointing.py文件中，第69行的返回值处理与第55行的前向传播函数定义不匹配。这种不一致导致内存回收机制无法正常工作。有趣的是，当视觉塔被冻结时，这个问题不会出现，因为冻结部分参数会改变模型的执行路径。

项目维护者很快定位到了问题所在，并在后续提交中修复了这个bug。修复后的版本经过测试证实可以正常工作。这个案例展示了在大型多模态模型训练中内存管理的重要性，特别是在使用各种优化技术时可能出现的边缘情况。

对于使用LLaMA-Factory进行多模态模型训练的用户，建议：

确保使用最新版本的代码库
在全参数微调时注意内存使用情况
如果遇到类似问题，可以尝试暂时冻结部分模块作为临时解决方案
关注项目中关于内存优化的相关配置选项

这个问题的解决也提醒我们，在深度学习框架中，内存管理组件的实现需要与模型架构保持高度一致，特别是在处理复杂多模态模型时。

登录后查看全文

LLaMA-Factory项目中Qwen2.5-VL模型全参数微调的内存优化实践

项目优选