NeuralForecast中使用静态外生变量的正确方法

2025-06-24 07:55:14作者：邬祺芯Juliet

静态外生变量在时间序列预测中的应用

在时间序列预测领域，外生变量是提升模型预测精度的重要手段。NeuralForecast作为一款强大的时间序列预测库，支持使用历史外生变量(hist_exog)和静态外生变量(stat_exog)来增强模型性能。本文将重点介绍如何正确使用静态外生变量。

静态外生变量的特点

静态外生变量是指那些在时间序列预测中不随时间变化的特征。这类变量通常包括：

产品ID
店铺ID
地理位置信息
产品类别
其他固定属性

与历史外生变量不同，静态外生变量在整个时间序列中保持不变，它们代表了时间序列本身的固有属性。

常见错误与解决方案

许多用户在使用NeuralForecast时会遇到类似错误："static exogenous variables not found in input dataset"。这通常是由于没有正确设置静态外生变量的数据格式导致的。

错误原因分析

数据格式不正确：试图将静态变量直接包含在主时间序列数据框中
变量类型问题：静态变量必须是数值类型
数据重复：为每个时间点都提供了静态变量值

正确实现方法

正确的做法是创建一个独立的数据框来存储静态外生变量，并通过static_df参数传递给模型。

# 主时间序列数据框
data = pd.DataFrame({
    'unique_id': [1] * 100,
    'ds': pd.date_range(start='2023-01-01', periods=100, freq='D'),
    'y': np.random.rand(100),
    'hist_exog1': np.random.rand(100)  # 历史外生变量
})

# 静态外生变量数据框
static_df = pd.DataFrame({
    'unique_id': 1,  # 与主数据框中的unique_id对应
    'product_id': 305,  # 静态变量1
    'store_type': 2     # 静态变量2
}, index=[0])  # 只需要一行数据

# 模型配置
nhits = NHITS(h=10, 
              input_size=20,
              hist_exog_list=['hist_exog1'],
              stat_exog_list=['product_id', 'store_type'])
              
# 训练模型
nf = NeuralForecast(models=[nhits], freq='D')
nf.fit(df=data, static_df=static_df)