Prophet时间序列预测中的SMAPE指标计算问题分析

2025-05-11 04:53:42作者：仰钰奇

Tool for producing high quality forecasts for time series data that has multiple seasonality with linear or non-linear growth.

项目地址：https://gitcode.com/gh_mirrors/pro/prophet

背景介绍

Prophet是Facebook开源的一个时间序列预测工具，广泛应用于商业预测、需求规划等领域。在模型评估阶段，Prophet提供了多种性能指标来评估预测效果，其中SMAPE（对称平均绝对百分比误差）是一个常用的指标。

SMAPE指标原理

SMAPE的计算公式基于Chen和Yang(2004)提出的方法，其数学表达式为：

SMAPE = |y - ŷ| / ((|y| + |ŷ|)/2)

其中y是实际值，ŷ是预测值。这个指标的特点是：

对称性：对高估和低估同等惩罚
百分比形式：便于不同量级数据的比较
取值范围在0-200%之间

问题发现

在Prophet的diagnostics.performance_metrics()函数实现中，当实际值y和预测值ŷ同时为零时，SMAPE计算会出现除零错误。虽然Python的numpy会将其处理为NaN值，但后续的rolling_mean_by_h()函数在分组计算时会自动排除NaN值，导致不同指标返回的结果长度不一致。

问题影响

这个bug会导致以下问题：

当预测值和实际值同时为零时，性能评估会失败
断言检查失败会中断整个评估流程
在真实数据中，零值情况并不罕见（如周末销售数据、节假日流量等）

解决方案分析

针对这个问题，可以考虑以下几种解决方案：

零值特殊处理：当y和ŷ同时为零时，直接返回0，因为完美预测应该得满分
添加微小扰动：在分母中加入一个极小值ε(如1e-10)避免除零
指标替换：在可能为零的场景下使用其他鲁棒性更强的指标

从数学合理性和实现简洁性考虑，第一种方案最为合适，因为当预测和实际都为零时，确实应该视为完美预测。

实际应用建议

在实际使用Prophet进行时间序列预测时，如果数据中包含大量零值，建议：

检查数据中零值的分布模式
考虑使用自定义的评估指标
对预测结果进行后处理（如非负截断）时要谨慎
关注Prophet的版本更新，确保使用的是修复此问题的版本

总结

时间序列预测中的评估指标选择和处理需要根据实际数据特点进行仔细考量。Prophet作为广泛使用的预测工具，其指标计算的鲁棒性对实际应用至关重要。理解这些底层实现细节，有助于我们更好地解释预测结果，并在必要时进行适当的调整或定制。

Tool for producing high quality forecasts for time series data that has multiple seasonality with linear or non-linear growth.

项目地址：https://gitcode.com/gh_mirrors/pro/prophet

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

flutter_flutter

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统