hftbacktest项目中NaN统计值问题的分析与解决

2025-06-30 11:46:02作者：平淮齐Percy

问题背景

在使用hftbacktest进行高频交易回测时，用户遇到了一个典型的数据处理问题：在BEERUSDT交易对的回测结果中，Sharpe比率、Sortino比率等关键统计指标显示为NaN值，而资金曲线图却显示正常。这种情况在BTCUSD交易对的回测中并未出现，表明问题与特定交易对的数据特性相关。

经过深入排查，发现问题的根本原因在于输入数据中存在NaN值。具体表现为：

针对这一问题，开发者提供了两种解决方案：

用户可以在获取记录数据后，手动过滤掉包含NaN值的行：

record_data = recorder.get(0)[2:]  # 跳过可能包含NaN的前几行
record = LinearAssetRecord(record_data)

或者更精确地过滤价格列中的NaN值：

record_data = recorder.get(0)
record_data = record_data[~np.isnan(record_data['price'])]  # 过滤所有价格NaN的行
record = LinearAssetRecord(record_data)

项目方已在代码层面修复此问题，新版本会自动在计算指标时跳过NaN值。用户可以通过升级到最新版本来解决此问题。

这个问题很好地展示了高频交易回测中数据质量的重要性，也为开发者提供了改进产品健壮性的机会。通过正确处理异常数据，可以确保回测结果的准确性和可靠性。

登录后查看全文