Gorilla项目中Mistral-7B模型的RAFT数据集微调实践

2025-05-19 22:55:38作者：尤峻淳Whitney

Gorilla: Training and Evaluating LLMs for Function Calls (Tool Calls)

项目地址：https://gitcode.com/gh_mirrors/go/gorilla

背景介绍

在大型语言模型(LLM)的微调过程中，数据集的格式处理是一个关键环节。特别是在使用RAFT(Retrieval-Augmented Fine-Tuning)方法对Mistral-7B-Instruct模型进行微调时，如何正确构建prompt模板直接影响模型的学习效果。

RAFT数据集结构分析

典型的RAFT数据集包含以下核心字段：

id：数据条目唯一标识符
type：数据类型分类
question：用户提问内容
context：相关上下文信息
oracle_context：理想上下文
cot_answer：思维链(Chain-of-Thought)形式的答案
instruction：任务指令说明

微调数据格式处理

在微调Mistral-7B-Instruct模型时，需要将上述多列数据转换为模型可接受的输入输出格式。正确的处理方式应该是：

输入文本(text)构建：
- 需要将instruction、context和question三个字段进行合理拼接
- 建议使用分隔符如"### Question"和"### Context"来区分不同部分
- 确保最终的输入文本既包含任务指令，也包含具体的问答内容
输出文本(ground_truth)处理：
- 直接使用cot_answer字段作为输出目标
- 该字段包含了详细的推理过程，有助于模型学习分步思考

实际应用建议

对于实际微调工作，建议采用以下最佳实践：

字段拼接策略：
- 将instruction放在最前面，明确任务类型
- 随后加入context提供背景信息
- 最后放置question作为具体问题
分隔符使用：
- 使用明显的标记区分不同部分
- 例如："### 指令"、"### 上下文"、"### 问题"等
格式验证：
- 检查拼接后的文本是否自然流畅
- 确保模型能够清晰区分指令部分和具体内容

技术要点总结

RAFT微调的核心在于保持检索增强的特性，因此context信息的合理融入至关重要。
Mistral-7B-Instruct模型对指令格式较为敏感，需要确保prompt模板与其预训练格式一致。
思维链(cot_answer)的保留可以显著提升模型的推理能力，不应简化为直接答案。

通过正确处理数据集格式，开发者可以充分发挥Mistral-7B模型在特定任务上的性能，实现高质量的微调效果。

Gorilla: Training and Evaluating LLMs for Function Calls (Tool Calls)

项目地址：https://gitcode.com/gh_mirrors/go/gorilla

登录后查看全文

项目优选

收起

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

deepin linux kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

cann-learning-hub

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。

Jupyter Notebook

昇腾LLM分布式训练框架