Pydantic模型序列化中继承类字段丢失问题解析

2025-05-09 00:18:56作者：冯爽妲Honey

在Pydantic V2版本中，开发者在使用模型继承和自定义序列化器时可能会遇到一个典型问题：当父类字段声明为联合类型时，子类实例在序列化过程中会丢失特有字段。这个问题源于Pydantic的序列化机制对类型提示的严格依赖。

问题现象

假设我们有一个基础模型Base和它的子类Inheriting，当我们将子类实例赋值给声明为父类类型的字段时，虽然验证阶段能够通过，但在序列化输出时子类特有的字段会丢失。这是因为Pydantic在序列化时根据字段的类型提示（此处为Base）来选择序列化器，而不是根据运行时实际的对象类型。

Pydantic的序列化机制核心依赖于类型系统。当模型字段被声明为特定类型时，序列化器会严格按照该类型的定义来处理数据。这种设计虽然保证了类型安全，但在处理多态场景时就会表现出局限性。

model_serializer装饰器的wrap模式允许开发者在基础序列化前后添加自定义逻辑，但基础序列化器仍然基于字段的类型提示工作。这就解释了为什么子类特有字段会在序列化过程中被忽略。

对于这个问题，Pydantic官方文档建议了几种处理方式：

使用Any类型配合验证器：通过将字段类型声明为Any并添加运行时类型验证，可以保留完整的子类信息。这种方法虽然灵活，但牺牲了部分类型安全性。
Duck Typing模式：利用Pydantic的类型系统特性，通过特殊配置让序列化器基于运行时类型而非声明类型工作。这种方法需要在模型配置中明确指定相关选项。
重构模型设计：如果可能，考虑使用组合而非继承，或者明确定义所有可能的子类类型。