ChatGLM3微调模型工具调用问题解析与解决方案

2025-05-16 14:21:57作者：毕习沙Eudora

问题背景

在使用ChatGLM3最新发布的微调模型时，开发者遇到了工具调用相关的问题。具体表现为模型无法正确解析工具参数，出现"Invalid syntax"错误。通过后台日志可以看到模型能够识别出需要调用哪个工具，但在参数解析环节出现了异常。

问题现象分析

从开发者提供的截图可以看到，在工具调用过程中，content字段意外地变成了None值。这导致工具调用流程无法正常进行，因为工具调用需要完整的参数内容才能执行后续操作。

根本原因

经过深入排查，发现问题出在数据处理环节。开发者在调用chat函数后，对返回的response进行了json.dumps处理，然后又将其添加到history中。这种处理方式实际上破坏了数据原有的结构，导致后续工具调用时无法正确解析参数。

解决方案

解决这个问题的方法非常简单：

直接使用chat函数返回的原始response，不需要额外进行json.dumps处理
将未经处理的response直接添加到history中
保持数据结构的完整性，确保工具调用时能够正确解析参数

最佳实践建议

在使用ChatGLM3进行微调模型开发时，建议遵循以下数据处理原则：

保持数据结构的原始性，避免不必要的序列化/反序列化操作
在history中存储数据时，保持与API返回一致的数据格式
对于工具调用场景，特别注意参数传递的完整性
在开发过程中添加充分的日志输出，便于快速定位问题

总结

这个案例展示了在使用大语言模型进行工具调用时，数据处理环节的重要性。一个小小的json.dumps操作就可能破坏整个工具调用流程。开发者在使用ChatGLM3等大模型时，应当充分理解数据流转的各个环节，保持数据结构的完整性，才能确保各项功能的正常运行。

ChatGLM3

ChatGLM3 - 由清华大学和智谱AI联合发布的新一代对话预训练模型，具备强大的语言理解和生成能力。

项目地址：https://gitcode.com/gh_mirrors/ch/ChatGLM3

登录后查看全文

项目优选

收起

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力