MedicalGPT项目中的SFT训练问题分析与解决方案

2025-06-18 21:00:31作者：胡易黎Nicole

MedicalGPT: Training Your Own Medical GPT Model with ChatGPT Training Pipeline. 训练医疗大模型，实现了包括增量预训练(PT)、有监督微调(SFT)、RLHF、DPO、ORPO、GRPO。

项目地址：https://gitcode.com/gh_mirrors/me/MedicalGPT

问题现象分析

在MedicalGPT项目中使用Baichuan模型进行监督式微调(SFT)后，出现了模型回答质量下降的问题。具体表现为：

回答长度明显缩短
回答内容准确性降低
新知识未能有效融入模型

这些问题在使用LoRA(低秩适应)方法进行微调时尤为明显。从实际测试对比可以看出，微调前的模型回答相对完整且准确，而微调后的模型回答变得简短且质量下降。

原因探究

造成这种现象可能有以下几个技术原因：

数据分布问题：使用的医疗数据集可能过于专业化，缺乏通用对话数据，导致模型在微调过程中"忘记"了基本的对话能力。
训练轮次不足：在监督式微调过程中，epoch设置过少可能导致模型未能充分学习新数据中的知识模式。
LoRA适配问题：低秩适应虽然能减少计算量，但也可能限制了模型的学习能力，特别是在处理专业领域知识时。
数据质量与多样性：专业医疗数据可能缺乏足够的问答多样性，导致模型倾向于生成简短、保守的回答。

解决方案

针对上述问题，可以采取以下改进措施：

混合数据训练：在专业医疗数据中加入一定比例的通用对话数据，保持模型的通用对话能力。建议比例为专业数据:通用数据=7:3或8:2。
增加训练轮次：将训练epoch提高到10轮左右，让模型有足够的时间学习新数据中的知识模式。
调整LoRA参数：适当增大LoRA的rank值，增加模型的可学习参数容量。同时可以尝试不同的alpha值来平衡新旧知识。
数据增强：对现有医疗数据进行适当扩充，增加问答的多样性和覆盖面，避免模型学习到过于狭窄的模式。
渐进式训练：先使用通用数据微调几轮，再加入专业数据进行训练，帮助模型更好地适应新领域。

实施建议

在实际操作中，建议采取以下步骤：

准备混合数据集，确保既有专业医疗内容，也包含通用对话数据
设置合理的训练参数：epoch=10，learning_rate=1e-5
监控训练过程中的loss变化，确保模型在学习而非简单记忆
定期进行验证测试，检查模型回答的质量变化
根据验证结果调整数据比例和训练参数

通过以上方法，可以有效改善SFT后模型回答质量下降的问题，使模型既能掌握新的医疗专业知识，又能保持良好的对话能力。

MedicalGPT: Training Your Own Medical GPT Model with ChatGPT Training Pipeline. 训练医疗大模型，实现了包括增量预训练(PT)、有监督微调(SFT)、RLHF、DPO、ORPO、GRPO。

项目地址：https://gitcode.com/gh_mirrors/me/MedicalGPT

登录后查看全文

项目优选

收起

deepin linux kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

昇腾LLM分布式训练框架

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。