Hypothesis项目中浮点数NaN在唯一性集合中的处理问题分析

2025-05-29 10:09:45作者：霍妲思

在Python测试框架Hypothesis的开发过程中，我们发现了一个与浮点数NaN（Not a Number）相关的边界条件问题。这个问题会导致使用unique=True参数的集合测试出现不稳定的行为，表现为测试结果时好时坏（flaky tests）。

问题现象

当测试代码尝试生成包含浮点数的唯一性集合（如列表、字典键或集合）时，如果生成的浮点数中包含多个NaN值，测试会出现意外失败。具体表现为：

经过深入排查，我们发现问题的核心在于Python对NaN值的特殊处理方式：

关键问题代码表现为：

n = 18444492273895866368
assert math.isnan(int_to_float(n))  # 生成一个NaN
assert int_to_float(n) not in [int_to_float(n)]  # 意外失败

浮点数生成过程：
- Hypothesis通过整数到浮点数的转换生成各种浮点值
- 对于NaN值，每次转换都会产生不同的对象引用
- 但根据IEEE 754标准，这些NaN在值比较时应该被视为相同
唯一性检查流程：
- 生成第一个NaN时被加入集合
- 生成第二个NaN时，由于是不同的对象引用，会通过is检查
- 但在值比较时又被判定为重复，导致后续处理逻辑混乱
类型系统交互：
- 当与类型变量(TypeVar)系统交互时，问题更加复杂
- 类型推导和缓存机制可能加剧了对象引用的不一致性

经过讨论，我们确定了以下解决方案：

这个案例给我们带来了几个重要的启示：

登录后查看全文