解决Phidata项目中Gemini API工具调用类型错误问题

2025-05-07 12:56:22作者：何举烈Damon

在Phidata项目中集成Google Vertex AI的Gemini模型时，开发者可能会遇到一个常见的工具调用问题：当使用多个工具或包含可选参数的工具时，API会返回400 INVALID_ARGUMENT错误，提示参数类型无效。本文将深入分析这一问题，并提供完整的解决方案。

问题背景

当开发者尝试在Phidata项目中使用Gemini模型(特别是gemini-2.0-flash-exp版本)配合多个工具时，Vertex AI API会返回类型错误。错误信息明确指出问题出在工具声明中的参数类型定义上，特别是当参数类型为可选(nullable)或多种类型组合时。

错误现象

典型错误表现为：

使用多个工具时API调用失败
包含可选参数的工具无法正常工作
错误信息显示参数类型为空或无效
仅在使用Vertex AI API时出现，直接使用Gemini API则正常

根本原因分析

经过深入调查，发现问题主要源于以下几个方面：

类型转换不完整：Phidata中的类型转换逻辑未能正确处理Google Vertex AI API所需的Schema格式
可选参数处理缺失：对Python类型提示中的Union[Type, None]或Type | None语法支持不足
多类型参数支持不足：当参数接受多种类型时，转换逻辑无法生成正确的Schema
必需字段设置错误：即使参数有默认值，转换后的Schema仍将其标记为必需

解决方案

1. 类型转换增强

核心解决方案是增强_convert_schema函数，使其能够：

正确处理基本类型(string, number, boolean等)
支持嵌套对象和数组
处理多类型参数(通过anyOf机制)
识别并正确处理可选参数

2. 可选参数处理

对于可选参数，需要特殊处理：

识别类型注解中的None类型
在生成的Schema中不将其标记为必需
确保类型转换时保留原始类型信息

3. 多类型支持

当参数接受多种类型时：

使用anyOf结构表示多类型
确保每种子类型都正确转换
处理嵌套的多类型情况

实现示例

以下是改进后的类型转换逻辑核心部分：

def _convert_schema(schema_dict):
    # 处理基本类型
    if "type" in schema_dict:
        if isinstance(schema_dict["type"], list):
            # 处理多类型情况
            return _handle_multitype(schema_dict)
        else:
            # 基本类型转换
            return _handle_basic_type(schema_dict)
    
    # 处理复杂类型
    elif "properties" in schema_dict:
        return _handle_object_type(schema_dict)
    
    # 处理数组类型
    elif "items" in schema_dict:
        return _handle_array_type(schema_dict)
    
    # 处理anyOf结构(多类型)
    elif "anyOf" in schema_dict:
        return _handle_anyof_type(schema_dict)