Hypothesis项目：如何测试Pydantic模型验证失败场景

2025-05-29 05:54:55作者：裘晴惠Vivianne

在Python测试领域，Hypothesis是一个强大的基于属性的测试库，它能够自动生成测试数据来验证代码的正确性。本文将探讨如何利用Hypothesis测试Pydantic模型验证失败的情况，这对于构建健壮的数据验证逻辑至关重要。

Pydantic模型验证基础

Pydantic是一个流行的Python数据验证库，通过继承BaseModel可以定义数据模型。例如一个简单的Album模型：

from pydantic import BaseModel
from uuid import UUID
from typing import Optional

class Album(BaseModel):
    id: UUID
    title: str
    description: Optional[str] = None

当使用model_validate()方法验证数据时，如果输入数据不符合模型定义（如缺少必填字段、类型不匹配等），Pydantic会抛出验证错误。

测试验证失败场景

测试验证成功的情况相对简单，可以使用Hypothesis的from_type策略生成符合模型的数据。但测试验证失败的情况更有挑战性，我们需要生成不符合模型要求的数据。

使用dictionaries策略

Hypothesis的st.dictionaries()策略可以灵活生成各种字典数据，包括不符合模型要求的：

from hypothesis import given
from hypothesis.strategies import dictionaries, text, uuids

@given(dictionaries(
    keys=text(),  # 随机键名
    values=text() # 随机值
))
def test_invalid_album_data(data):
    try:
        Album.model_validate(data)
        assert False, "验证应该失败但通过了"
    except ValueError:
        pass  # 预期中的验证失败

这个测试会生成各种随机字典，大多数情况下会因不符合Album模型要求而触发验证错误。

更精确的无效数据生成

如果需要更精确地控制无效数据的类型，可以组合多个策略：

from hypothesis.strategies import one_of, none, integers

invalid_strategies = one_of(
    dictionaries(keys=text(), values=text()),  # 完全随机字典
    dictionaries(keys=text(), values=one_of(text(), integers(), none())),  # 混合类型值
    # 特定无效情况
    st.fixed_dictionaries({
        "id": text(),  # UUID应为字符串但格式错误
        "title": none()  # 必填字段为None
    })
)