Pydantic中如何自定义扩展内置集合类型的验证逻辑

2025-05-09 07:41:45作者：宣利权Counsellor

**拥抱数据验证的艺术——Pydantic，Python 3.8+的智能守护者** 🛡️🚀 数据在手，但格式杂乱无章？让Pydantic一展身手！借助类型提示，Pydantic使数据清洗变得优雅而高效，是现代编程的默契伙伴。无论是快速原型还是大型项目，它都能与你的编码习惯无缝对接，提升代码质量和可读性。Pydantic V2全新升级，不仅性能飙升，功能丰富，还能助你平滑过渡旧版本。一键安装，即刻体验数据验证的新境界。想要了解更多，或是贡献一份力量，文档和开源社区等你来探索！👩‍💻👨‍💻🌟

项目地址：https://gitcode.com/gh_mirrors/pyd/pydantic

在实际开发中，我们经常需要扩展Python内置的集合类型（如tuple、list等）来添加自定义方法。但在使用Pydantic进行数据验证时，这些自定义类型会遇到验证失败的问题。本文将深入探讨如何通过实现__get_pydantic_core_schema__方法来解决这个问题。

问题背景

假设我们有一个文件管理系统，需要处理文件列表数据。我们可能希望创建一个增强版的元组类型，既能保持元组的特性，又能添加自定义方法。例如：

class File(BaseModel):
    name: str
    size: int

class EnhancedFileTuple(tuple[File, ...]):
    def get_total_size(self) -> int:
        return sum(file.size for file in self)

当我们在Pydantic模型中使用这个自定义类型时，会遇到验证错误，因为Pydantic不知道如何处理这个非标准类型。

解决方案

Pydantic提供了__get_pydantic_core_schema__这个类方法，允许我们指定自定义类型的验证逻辑。这个方法需要返回一个核心模式(CoreSchema)，告诉Pydantic如何验证这个类型。

对于扩展内置集合类型的情况，我们可以这样实现：

from pydantic_core import CoreSchema, core_schema
from pydantic import GetCoreSchemaHandler

class EnhancedFileTuple(tuple[File, ...]):
    @classmethod
    def __get_pydantic_core_schema__(
        cls, source_type: Any, handler: GetCoreSchemaHandler
    ) -> CoreSchema:
        # 告诉Pydantic使用标准元组的验证逻辑
        return handler(tuple[File, ...])
    
    def get_total_size(self) -> int:
        return sum(file.size for file in self)

实现原理

核心模式(CoreSchema): 这是Pydantic内部用于描述如何验证和序列化数据的结构。通过实现__get_pydantic_core_schema__，我们可以为自定义类型提供这种描述。
处理程序(handler): 这是一个由Pydantic提供的工具，可以将类型转换为对应的核心模式。通过调用handler并传入基础类型，我们复用Pydantic已有的验证逻辑。
类型保持: 虽然我们使用了标准元组的验证逻辑，但验证后的结果仍会保持为我们的自定义类型，因此自定义方法仍然可用。

实际应用示例

class FileSystemModel(BaseModel):
    recent_files: EnhancedFileTuple

# 可以正常验证
model = FileSystemModel.model_validate({
    "recent_files": [
        {"name": "doc.txt", "size": 1024},
        {"name": "img.jpg", "size": 2048}
    ]
})

# 可以使用自定义方法
print(model.recent_files.get_total_size())  # 输出3072