QwenLM/Qwen3项目中函数调用场景下的特殊符号输出问题分析与解决方案

2025-05-11 10:30:52作者：伍希望

问题现象

在Qwen2.5-72B-Instruct模型使用函数调用(Fncall)功能时，开发者发现当对话历史中存在连续用户消息或空助手回复时，模型会持续输出特殊符号"✿"。该问题在NVIDIA和Ascend不同硬件平台均能复现，且不受精度格式(fp16/bf16)或采样参数调整的影响。

根本原因分析

经过技术团队深入排查，发现问题源于以下两个关键因素：

对话模板滥用：
- 连续的用户消息未合并处理
- 存在空的助手回复消息未清理
- 函数调用结果未被完整保留在对话历史中
训练数据特性：
- 模型基于"✿FUNCTION✿"标记体系进行函数调用训练
- 多轮对话场景下的特殊符号处理机制存在边界情况

解决方案

针对该问题，我们推荐以下最佳实践：

对话模板规范

合并连续的用户消息为单条消息
移除所有空的助手回复

完整保留函数调用过程：

<tool_call>
{"name": "functionName", "arguments": {...}}
</tool_call>

确保包含函数调用结果：
```
<tool_response>
{...}
</tool_response>
```

参数调优建议

降低"✿"符号的生成概率
保持对话历史的完整性：
- 避免人为删除中间过程
- 确保每轮交互都有明确的内容

技术启示

该案例揭示了大型语言模型在特定场景下的行为特点：

对话历史的规范性直接影响模型输出质量
函数调用等高级功能需要严格遵循训练时的数据格式
多轮对话状态管理是工程实现的关键难点

版本兼容性说明

经测试，该问题在以下版本存在：

Qwen2.5系列（包括72B-Instruct）
Qwen2-7B-Instruct

建议用户关注官方更新，后续版本将优化相关处理逻辑。对于生产环境应用，建议通过完整的对话历史记录和规范的API调用规避此类问题。

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

flutter_flutter

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

ohos_react_native

React Native鸿蒙化仓库

基于golang开发的网关。具有各种插件，可以自行扩展，即插即用。此外，它可以快速帮助企业管理API服务，提高API服务的稳定性和安全性。

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理