GLM-4工具调用微调数据构建指南

2025-06-03 19:18:43作者：瞿蔚英Wynne

在GLM-4项目中，工具调用（Tool Calling）是一项重要功能，它允许模型根据用户需求动态调用外部工具并返回结果。本文将详细介绍如何构建工具调用的微调数据，帮助开发者更好地理解和应用这一功能。

工具调用微调数据的基本结构

工具调用的微调数据采用JSON格式，主要包含以下几个部分：

系统消息（system）：定义可用的工具列表及其参数规范
用户消息（user）：用户的输入或问题
助手响应（assistant）：模型生成的工具调用请求
观察结果（observation）：工具执行后返回的结果
最终响应（assistant）：模型基于工具结果生成的最终回答

单工具调用示例

以下是一个天气查询工具的完整微调数据示例：

{
    "messages":[
        {
            "role": "system",
            "content": null,
            "tools": [
                {
                    "type": "function",
                    "function": {
                        "name": "weather",
                        "description": "该工具只能得到指定城市的天气信息",
                        "parameters": {
                            "type": "object",
                            "properties": {
                                "city": {
                                    "description": "城市名称",
                                    "type": "string"
                                }
                            },
                            "required": ["city"]
                        }
                    }
                }
            ]
        },
        {
            "role": "user",
            "content": "今天深圳天气怎么样"
        },
        {
            "role": "assistant",
            "content": 'weather\n{"city": "深圳"}'
        },
        {
            "role": "observation",
            "content": "city: 深圳, weather: 晴 temperature: 17.0℃，humidity: 49.0%，winddirection: 北，windpower: ≤3"
        },
        {
            "role": "assistant",
            "content": "今天深圳的天气预报显示为晴，气温约为17.0℃，相对湿度为49.0%，风向为北风，风力较小，不超过3级。"
        }
    ]
}

多工具调用的处理

当系统中有多个工具时，微调数据的构建需要注意以下几点：

工具列表定义：在system消息中列出所有可用工具及其参数规范
工具选择逻辑：根据用户问题选择最合适的工具进行调用
结果整合：可能需要组合多个工具的结果来回答复杂问题

多工具场景下的微调数据示例如下：

{
    "messages":[
        {
            "role": "system",
            "content": null,
            "tools": [
                {
                    "type": "function",
                    "function": {
                        "name": "weather",
                        "description": "获取城市天气信息",
                        "parameters": {...}
                    }
                },
                {
                    "type": "function",
                    "function": {
                        "name": "purchase_order",
                        "description": "解析采购订单信息",
                        "parameters": {...}
                    }
                }
            ]
        },
        {
            "role": "user",
            "content": "深圳今天的天气如何？另外请帮我解析这个采购订单..."
        },
        {
            "role": "assistant",
            "content": 'weather\n{"city": "深圳"}\npurchase_order\n{...}'
        },
        {
            "role": "observation",
            "content": "weather_result:..., purchase_order_result:..."
        },
        {
            "role": "assistant",
            "content": "深圳今天的天气...关于采购订单..."
        }
    ]
}