Open-Instruct项目中的SFT训练损失下降问题分析

2025-06-27 00:01:00作者：毕习沙Eudora

问题背景

在使用Open-Instruct项目进行监督微调(SFT)训练时，特别是在MATH数据集上，开发者们观察到一个共同现象：训练损失(loss)下降非常缓慢，甚至在某些情况下几乎看不到明显下降。这种现象在多个不同规模的模型(如Llama-3-8B和OLMo-13B)上都出现了。

典型的SFT训练配置包括以下关键参数：

从训练曲线中可以观察到：

这种现象在SFT训练中是正常的，主要原因包括：

预训练模型已经具备较强能力：像Llama-3和OLMo这样的大模型在预训练阶段已经学习了大量知识，SFT阶段主要是调整模型的行为风格和特定任务的响应方式，而非学习全新知识。
小学习率的影响：5e-6的学习率非常保守，这是为了避免破坏模型已有的知识表示，但同时也会导致参数更新缓慢。
损失计算方式：使用sum reduction而非mean reduction意味着损失值会随着序列长度变化，可能掩盖了实际的改进。
评估指标选择：MMLU等通用评估指标对SFT的改进不敏感，更适合观察预训练效果。SFT的效果更适合用特定任务的评估来衡量。

在Open-Instruct项目中进行SFT训练时，缓慢的损失下降是正常现象，特别是当使用已经强大的基础模型时。开发者应更关注epoch间的改进和特定任务的评估结果，而非单纯依赖训练损失曲线的陡峭程度。理解这一现象有助于更合理地设置训练预期和评估策略。

登录后查看全文