LLM项目中的工具调用机制设计与实现

2025-05-30 03:53:04作者：牧宁李

在LLM项目的开发过程中，工具调用(Tool Calling)机制是一个重要的功能扩展点。本文将深入探讨该项目的工具调用API设计思路和实现细节。

工具调用基础概念

工具调用允许语言模型在执行过程中调用外部定义的函数或工具，获取更精确的信息或执行特定操作。这大大扩展了模型的能力边界，使其不再局限于单纯的文本生成。

核心设计决策

项目采用了Tool数据类作为工具定义的核心载体，主要包含以下关键属性：

name: 工具名称，作为唯一标识符
description: 工具描述，帮助模型理解工具用途
input_schema: 输入参数的JSON Schema定义
implementation: 可选的实际执行函数

这种设计既保持了灵活性，又能满足不同模型后端的需求。

实现细节解析

从函数自动生成工具

项目实现了一个巧妙的Tool.function()类方法，可以从Python函数自动生成工具定义：

def get_weather(city: str) -> str:
    """获取指定城市的天气"""
    return f"{city}的天气晴朗"

tool = Tool.function(get_weather)

该方法会：

提取函数名作为工具名
使用函数文档字符串作为工具描述
分析函数参数类型注解生成输入模式
保留函数引用以便后续执行

输入模式处理

输入模式采用JSON Schema规范，支持从Python类型注解自动转换。例如：

def example(name: str, age: int):
    pass

会生成以下输入模式：

{
  "properties": {
    "name": {"type": "string"},
    "age": {"type": "integer"}
  },
  "required": ["name", "age"],
  "type": "object"
}

执行流程

完整的工具调用流程包括：

用户提问时指定可用工具列表
模型决定是否以及如何调用工具
解析模型的工具调用请求
执行对应函数并获取结果
将结果返回给模型进行最终回答

设计考量与取舍

在实现过程中，开发者面临几个关键决策：

输出模式：最初设计了输出模式，但发现主流API并不强制执行，最终选择简化
异步支持：虽然当前实现基于同步函数，但保留了未来支持异步的扩展性
函数绑定：工具定义可选择性地绑定实际函数，保持灵活性

实际应用示例

以下是一个完整的使用示例：

model = llm.get_model("gpt-4")

def get_weather(city: str) -> str:
    """获取指定城市的天气"""
    return f"{city}的天气晴朗"

response = model.prompt(
    "北京天气如何？",
    tools=[Tool.function(get_weather)]
    
# 处理工具调用
for call in response.tool_calls():
    result = call.tool.implementation(**call.arguments)
    print(f"调用{call.name}得到结果: {result}")