XTuner项目中的模型格式转换与合并技术解析

2025-06-13 15:25:35作者：伍希望

A toolkit for efficiently fine-tuning LLM (InternLM, Llama, Baichuan, QWen, ChatGLM)

项目地址：https://gitcode.com/GitHub_Trending/xt/xtuner

模型格式转换的关键参数

在XTuner项目中进行模型微调后，用户经常需要将训练结果转换为HuggingFace格式以便后续使用。标准转换命令生成的输出目录结构可能不符合预期，特别是缺少.safetensors格式文件。通过添加--safe-serialization参数可以解决这一问题，该参数会强制生成更安全的.safetensors格式文件而非传统的.bin格式。

完整模型结构的构建

微调后的模型输出通常包含三个主要部分：

llm_adapter：包含适配器配置和模型权重
projector：投影层相关文件
xtuner_config.py：XTuner的配置文件

但实际部署时，我们往往需要完整的模型结构，包括分词器配置、生成配置等。这需要通过额外的模型合并步骤来实现。

模型合并的关键步骤

要将微调后的适配器与基础模型合并，形成完整的可部署模型，需要执行以下关键操作：

适配器合并：使用xtuner convert merge命令将微调后的适配器与原始基础模型合并
文件重组：将合并后的模型文件与其他必要组件（如projector目录）组合
格式统一：确保所有模型文件都采用.safetensors格式

合并后的完整模型结构包含多个分片的模型文件、索引文件以及各种配置文件，这种结构可以直接用于推理任务。

实际应用建议

对于需要在生产环境中部署模型的用户，建议：

始终使用--safe-serialization参数确保模型安全性
合并步骤不可省略，它是获得完整可部署模型的关键
检查最终模型目录是否包含所有必要组件，特别是tokenizer相关文件
对于大型模型，注意分片文件的数量和大小是否符合预期

通过遵循这些步骤，用户可以顺利将XTuner微调后的模型转换为可直接用于推理的完整格式。

A toolkit for efficiently fine-tuning LLM (InternLM, Llama, Baichuan, QWen, ChatGLM)

项目地址：https://gitcode.com/GitHub_Trending/xt/xtuner

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

flutter_flutter

Ascend Extension for PyTorch

ohos_react_native

React Native鸿蒙化仓库

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。