Vocode-Python项目中函数调用参数传递问题的分析与解决

2025-06-25 19:34:53作者：宣利权Counsellor

前言

在开发基于Vocode-Python的语音交互系统时，实现自定义Action功能是一个常见需求。最近在项目开发过程中，遇到了一个关于函数调用参数传递和结果返回的问题，经过深入分析和排查，最终找到了解决方案。本文将详细记录这一问题的发现、分析和解决过程，为遇到类似问题的开发者提供参考。

问题现象

在Vocode-Python项目中创建自定义Action时，发现以下两个主要问题：

参数传递失败：在自定义Action的run方法中，通过打印语句检查传入的action_input.params时，发现参数为空，表明参数未能正确传递到函数内部。
结果返回异常：虽然Action内部能够正确生成结果数据，但这些数据似乎未能正确返回给调用方，导致LLM无法获取到预期的响应数据。

问题复现环境

该问题出现在以下技术栈环境中：

LLM: GPT-4
语音转录: Deepgram
语音合成: Eleven Labs
电话服务: Twilio
实时流媒体通信场景

问题分析过程

初步排查

首先检查了自定义Action的实现代码，确认了以下几点：

Action类正确继承了BaseAction
参数和响应模型都正确定义
Action配置已正确添加到工厂类中

深入调试

通过在关键位置添加调试打印语句，发现了几个关键现象：

参数类型变化：在create_action_input方法中，参数在传入时类型正确（如TwilioSendSmsParameters），但在创建ActionInput对象后，参数类型变成了pydantic.v1.main.BaseModel，且内容为空。
响应数据丢失：Action内部生成的响应数据在返回过程中丢失，最终LLM接收到的响应对象内容为空。

根本原因

经过深入分析，发现问题根源在于Pydantic版本不兼容。项目中使用的是pydantic.v1，但在自定义Action中错误地导入了标准pydantic包：

# 错误导入方式
from pydantic import BaseModel, Field

# 正确导入方式应该是
from pydantic.v1 import BaseModel, Field

这种版本不匹配导致了序列化和反序列化过程中的数据丢失。

解决方案

修复方法

将自定义Action中的所有Pydantic相关导入从标准pydantic改为pydantic.v1：

from pydantic.v1 import BaseModel, Field
from typing import Optional, Type
from vocode.streaming.action.base_action import BaseAction
from vocode.streaming.models.actions import (
    ActionConfig,
    ActionInput,
    ActionOutput,
    ActionType,
)