Google Gemini Python SDK中的Content对象JSON序列化问题解析

2025-07-03 06:21:30作者：秋泉律Samson

问题背景

在使用Google Gemini的Python SDK开发聊天应用时，开发者遇到了一个常见的技术挑战：Content对象无法直接进行JSON序列化。这个问题在构建API服务时尤为突出，因为现代Web应用通常需要将数据序列化为JSON格式进行传输。

问题表现

当开发者尝试将包含Content对象的聊天历史记录作为API响应返回时，会遇到类型错误提示："Object of type Content is not JSON serializable"。这个错误表明Flask框架在尝试将响应对象转换为JSON字符串时失败了。

技术分析

Content对象是Gemini Pro模型中用于表示聊天历史记录的数据结构，类似于Chat Bison模型中的ChatMessage对象。然而，与ChatMessage不同的是，Content对象默认没有实现JSON序列化接口，这导致了上述问题。

解决方案比较

方案一：使用jsonpickle库

jsonpickle是一个专门用于Python对象序列化的第三方库，可以处理复杂的Python对象结构。虽然这是一个通用解决方案，但它可能会引入额外的依赖，并且生成的JSON结构可能不够简洁。

方案二：自定义字段序列化器

更优雅的解决方案是使用Pydantic的field_serializer装饰器创建自定义序列化逻辑。这种方法可以直接控制输出的JSON结构，保持API响应的简洁性。

@field_serializer('history')
def serialize_history(self, history: list[Content]):
    return [x.to_dict() for x in history]

这种方案的优势在于：

直接使用SDK提供的to_dict()方法
保持了代码的简洁性
输出的JSON结构清晰可读

方案三：手动构建字典结构

对于需要更精细控制输出结构的情况，可以完全手动构建字典：

@field_serializer('history')
def serialize_history(self, history: list[Content], _info):
    return [
        {
            'role': hist.role,
            'parts': [
                {'text': part.text}
                for part in hist.parts
            ]
        }
        for hist in history
    ]

这种方法虽然代码量稍多，但可以完全自定义输出格式，适合有特殊需求的场景。

最佳实践建议

一致性：在整个项目中保持统一的序列化方式
性能考虑：对于高频调用的API，简单直接的序列化方式性能更佳
可维护性：将序列化逻辑集中管理，便于后期维护
版本兼容：考虑未来SDK升级可能带来的变化

总结

Google Gemini Python SDK中的Content对象序列化问题是一个典型的接口兼容性挑战。通过合理的序列化策略，开发者可以轻松解决这个问题，构建稳定高效的聊天应用API。建议根据项目具体需求选择最适合的解决方案，并在项目文档中明确记录所采用的序列化方式，以方便团队协作和后期维护。

generative-ai-python

The official Python library for the Google's Gemini API

项目地址：https://gitcode.com/gh_mirrors/gen/generative-ai-python

登录后查看全文