LLaMA-Factory项目中Qwen2.5模型函数调用模板的优化与改进

2025-05-02 10:55:23作者：庞队千Virginia

在LLaMA-Factory项目的0.9.1版本之前，Qwen模型的函数调用模板使用了DEFAULT_TOOL_PROMPT，这种实现基于ReAct工具调用思想。然而，这种设计与官方Qwen2.5的函数调用模板存在不一致性，这在实际应用中带来了两个主要问题。

首先，ReAct方式在调用工具时会输出完整的思考过程，这导致模型生成工具调用的推理时间显著延长。这种延迟不仅影响用户体验，更重要的是会干扰流式输出中对是否调用工具的判断逻辑。

其次，由于vLLM推理框架采用的是与官方一致的function call模板，而LLaMA-Factory微调时使用了不同的模板，这种不一致性会导致一个严重问题：当用户尝试使用vLLM部署经过LLaMA-Factory微调的模型时，模型的表现会明显下降。

项目团队在发现问题后迅速响应，通过代码提交修复了这一问题。这次优化确保了LLaMA-Factory中的模板实现与官方Qwen2.5保持完全一致，从而解决了上述两个关键问题。这种一致性的改进不仅提升了模型性能，也为用户提供了更流畅的部署体验。

对于使用LLaMA-Factory进行模型微调的用户来说，这一改进意味着他们可以更放心地在不同推理框架间迁移模型，而不用担心因为模板不一致导致的性能损失。同时，更高效的函数调用机制也为构建复杂的AI应用提供了更好的基础。

登录后查看全文

收起