InternLM项目中的SFT训练数据格式详解

2025-05-31 10:21:20作者：乔或婵

Official release of InternLM series (InternLM, InternLM2, InternLM2.5, InternLM3).

项目地址：https://gitcode.com/gh_mirrors/in/InternLM

什么是SFT训练

在大型语言模型(LLM)训练中，SFT(Supervised Fine-Tuning)监督微调是一个关键步骤。它是指在预训练模型基础上，使用特定领域或任务的有监督数据进行进一步训练，使模型能够更好地适应特定应用场景。

InternLM项目中的SFT数据格式要求

InternLM项目推荐使用XTuner工具进行模型微调，其数据格式要求如下：

1. 基本格式结构

SFT训练数据通常采用JSON格式，每个样本包含一个对话轮次或多轮对话。基本结构如下：

[
    {
        "conversation": [
            {
                "system": "你是一个有帮助的AI助手",
                "input": "如何学习深度学习？",
                "output": "学习深度学习可以从以下几个方面入手..."
            }
        ]
    }
]

2. 多轮对话格式

对于需要上下文的多轮对话场景，可以采用以下格式：

[
    {
        "conversation": [
            {
                "input": "深度学习的核心概念是什么？",
                "output": "深度学习的核心概念包括..."
            },
            {
                "input": "能详细解释一下神经网络吗？",
                "output": "神经网络是由多个神经元组成的..."
            }
        ]
    }
]

3. 系统提示词

可以在对话开始时设置系统提示词，指导模型的行为：

{
    "system": "你是一个专业的AI编程助手，擅长Python和深度学习",
    "conversation": [
        {
            "input": "如何用PyTorch实现一个CNN？",
            "output": "在PyTorch中实现CNN的基本步骤如下..."
        }
    ]
}

数据准备建议

数据质量：确保训练数据的质量和多样性，避免偏见和错误信息
数据规模：根据任务复杂度，准备足够数量的高质量样本
格式统一：保持数据格式的一致性，便于XTuner工具处理
领域适配：针对特定应用场景收集和整理数据

数据处理技巧

数据清洗：去除重复、低质量或无关的样本
数据增强：通过改写、扩展等方式增加数据多样性
平衡分布：确保不同类别或主题的样本分布合理
评估集划分：预留部分数据用于微调后的模型评估

通过遵循这些数据格式要求和准备建议，开发者可以更有效地在InternLM项目中进行模型微调，获得性能更优的领域专用模型。

Official release of InternLM series (InternLM, InternLM2, InternLM2.5, InternLM3).

项目地址：https://gitcode.com/gh_mirrors/in/InternLM

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

flutter_flutter

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

ohos_react_native

React Native鸿蒙化仓库

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

cangjie_compiler

仓颉编译器源码及 cjdb 调试工具。