Pydantic中Json[T]类型的高级使用技巧

2025-05-09 03:27:46作者：苗圣禹Peter

在Python生态中，Pydantic是一个强大的数据验证和设置管理库，它通过Python类型注解来提供数据验证功能。在实际开发中，我们经常会遇到需要处理JSON嵌套JSON（即JSON字符串中包含另一个JSON字符串）的场景。本文将深入探讨Pydantic中Json[T]类型的使用技巧和最佳实践。

Json[T]类型的基本用法

Pydantic的Json[T]类型主要用于验证和序列化JSON字符串。它的基本行为是：

在验证阶段，确保输入是有效的JSON字符串
在序列化阶段，将内部类型T转换为JSON字符串

from pydantic import BaseModel, Json

class InnerModel(BaseModel):
    field: str

class OuterModel(BaseModel):
    nested: Json[InnerModel]

常见问题场景

开发者在使用Json[T]类型时，经常会遇到以下挑战：

创建对象时的输入限制：Json[T]类型要求输入必须是字符串，不能直接传入模型实例
序列化控制：需要精确控制何时将内部对象序列化为JSON字符串
类型安全性：需要确保输入既可以是JSON字符串，也可以是模型实例，同时保持类型安全

解决方案

方案1：使用模型方法手动转换

最直接的方法是手动调用model_dump_json()方法：

inner = InnerModel(field="value")
outer = OuterModel(nested=inner.model_dump_json())

这种方法简单直接，但需要开发者手动处理序列化，不够优雅。

方案2：使用验证器包装

通过自定义验证器，我们可以扩展Json[T]的行为：

from typing import Any
from pydantic import BaseModel, Json, validator

class OuterModel(BaseModel):
    nested: Json[InnerModel]
    
    @validator('nested', pre=True)
    def validate_nested(cls, v):
        if isinstance(v, InnerModel):
            return v.model_dump_json()
        return v

这种方法更加灵活，但需要为每个字段编写验证器。

方案3：使用Annotated和PlainSerializer

Pydantic 2.x版本引入了更强大的类型注解系统：

from typing import Annotated
from pydantic import BaseModel, PlainSerializer
from pydantic_core import to_json

class OuterModel(BaseModel):
    nested: Annotated[
        Json[InnerModel], 
        PlainSerializer(lambda x: to_json(x).decode())
    ]

这种方法结合了类型安全和序列化控制，是目前最推荐的解决方案。