Langfuse项目与Google Vertex AI Gemini集成中的令牌验证问题解析

2025-05-22 07:25:04作者：瞿蔚英Wynne

🪢 Open source AI engineering platform: LLM evals, observability, metrics, prompt management, playground, datasets. Integrates with OpenTelemetry, LangChain, OpenAI SDK, LiteLLM, and more. 🍊YC W23

项目地址：https://gitcode.com/GitHub_Trending/la/langfuse

问题背景

在使用Langfuse Python SDK与Google Vertex AI Gemini模型(特别是2.0 Flash和1.5 Pro版本)集成时，开发人员遇到了一个关于令牌使用详情(usageDetails)的验证错误。这个问题主要出现在从其他AI服务(如Azure OpenAI)迁移到Gemini模型时，Langfuse的UpdateGenerationBody在进行数据验证时抛出异常。

错误表现

系统会报告7个验证错误，主要集中在usageDetails字段上：

prompt_tokens_details、candidates_tokens_details和cache_tokens_details的值不是有效整数
缺少必需的prompt_tokens、completion_tokens和total_tokens字段
prompt_tokens_details中的modality字段值不是有效整数

这些错误表明Langfuse SDK期望的令牌使用数据结构与Gemini模型返回的实际数据结构不匹配。

技术分析

数据结构差异

Langfuse SDK期望的usageDetails结构有两种可能形式：

字符串到整数的映射
遵循OpenAIUsageSchema的结构，包含prompt_tokens、completion_tokens和total_tokens等整数字段

然而，Gemini模型返回的令牌使用数据采用了不同的命名约定和结构：

使用input_tokens代替prompt_tokens
使用output_tokens代替completion_tokens
数据可能存储在generation_info["usage_metadata"]或message.usage_metadata中

版本兼容性问题

这个问题在不同版本的google-cloud-aiplatform库中表现不同。较新版本(1.78.0之后)似乎改变了数据返回格式，导致与Langfuse的验证机制不兼容。

解决方案

临时解决方案

目前确认有效的临时解决方案是将google-cloud-aiplatform降级到1.78.0版本：

pip install google-cloud-aiplatform==1.78.0

代码层解决方案

对于需要保持新版本库的用户，可以通过重写on_llm_end方法手动转换数据结构：

def on_llm_end(self, response, **kwargs):
    # 提取并转换Gemini的用量数据
    transformed_usage = None
    generation = response.generations[-1][-1]
    
    if isinstance(generation, ChatGeneration):
        # 检查可能的用量数据位置
        usage = None
        if generation.generation_info and "usage_metadata" in generation.generation_info:
            usage = generation.generation_info["usage_metadata"]
        elif hasattr(generation.message, "usage_metadata"):
            usage = generation.message.usage_metadata

        if usage:
            # 转换数据结构
            transformed_usage = {
                "prompt_tokens": usage.get("input_tokens", 0),
                "completion_tokens": usage.get("output_tokens", 0),
                "total_tokens": usage.get("total_tokens", 0),
            }
            kwargs["usage"] = transformed_usage

    # 调用父类方法
    try:
        super().on_llm_end(response, **kwargs)
    except TypeError as e:
        # 处理版本兼容性问题
        if "RunTree.end() got an unexpected keyword argument 'output'" in str(e):
            if 'output' in kwargs:
                del kwargs['output']
            super().on_llm_end(response, **kwargs)
        else:
            raise