Meta Llama 3.2-11B-Vision 全参数微调模型保存问题解析

2025-05-13 06:08:02作者：邵娇湘

Examples and recipes for Llama 2 model

项目地址：https://gitcode.com/gh_mirrors/ll/llama-recipes

问题背景

在使用 Meta Llama 3.2-11B-Vision 模型进行全参数微调(full fine-tuning)时，开发者遇到了模型保存格式的问题。与常见的 Hugging Face Transformers 标准格式不同，全参数微调后生成的模型文件采用了分布式检查点(distributed checkpoint)格式，这给后续的模型推理带来了不便。

现象描述

当使用官方提供的 finetuning.py 脚本进行全参数微调时，模型权重被保存为以下格式：

__0_0.distcp
__1_0.distcp 
__2_0.distcp
__3_0.distcp
train_params.yaml

这种格式与 Transformers 库期望的标准模型结构不兼容，导致无法直接用于推理任务。此外，开发者指定的输出目录也没有按预期保存模型文件。

技术原理

这种保存格式是由于 Meta Llama 采用了 Fully Sharded Data Parallel (FSDP) 训练策略。FSDP 是一种高效的大模型训练技术，它会在多个GPU上分片保存模型参数。当启用 --enable_fsdp 参数时，系统会自动使用这种分布式检查点格式来保存模型状态。

解决方案

Meta Llama 团队已经提供了模型格式转换工具，可以将分布式检查点格式转换为标准的 Transformers 格式。这个转换过程主要包括以下步骤：

收集分布在多个文件中的模型参数
重组模型结构
生成符合 Hugging Face 标准的模型文件

最佳实践建议

对于需要进行全参数微调的开发者，建议遵循以下流程：

首先完成模型的微调训练
使用官方提供的转换脚本将分布式检查点转换为标准格式
在转换后的模型基础上进行推理或进一步部署

注意事项

转换过程可能需要较大的临时存储空间，特别是对于11B参数的大模型
确保转换环境与训练环境具有相同的依赖版本
转换后的模型可以像常规 Transformers 模型一样加载和使用

通过这种方式，开发者可以充分利用 FSDP 的高效训练优势，同时获得兼容性良好的最终模型格式。

Examples and recipes for Llama 2 model

项目地址：https://gitcode.com/gh_mirrors/ll/llama-recipes

登录后查看全文

热门内容推荐

1 【亲测免费】开源项目 `build-your-own-x` 使用指南 2 【亲测免费】探索科技之旅：《Build Your Own X》项目详解 3 GitHub_Trending/bu/build-your-own-x自动化：CI/CD流程在自制项目中的应用 4 从零打造智能家居系统：用build-your-own-x实现家庭自动化

最新内容推荐

Degrees of Lewdity中文汉化终极指南：零基础玩家必看的完整教程 Unity游戏翻译神器：XUnity Auto Translator 完整使用指南 PythonWin7终极指南：在Windows 7上轻松安装Python 3.9+终极macOS键盘定制指南：用Karabiner-Elements提升10倍效率 Pandas数据分析实战指南：从零基础到数据处理高手 Qwen3-235B-FP8震撼升级：256K上下文+22B激活参数 7步搞定机械键盘PCB设计：从零开始打造你的专属键盘终极WeMod专业版解锁指南：3步免费获取完整高级功能 DeepSeek-R1-Distill-Qwen-32B技术揭秘：小模型如何实现大模型性能突破音频修复终极指南：让每一段受损声音重获新生

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

昇腾LLM分布式训练框架

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统