Darts项目中自定义编码器特征滞后处理的实践指南

2025-05-27 12:40:14作者：宣聪麟

背景介绍

在使用Darts项目中的LightGBM模型进行时间序列预测时，开发者经常会遇到需要同时使用编码器生成的特征和自定义滞后特征的情况。本文将详细介绍如何正确配置模型参数，避免自动生成的滞后特征与自定义编码器特征之间的冲突。

问题核心

当使用add_encoders参数添加周期性编码器（如时间特征编码）时，Darts会自动为这些编码特征生成滞后项。如果同时设置了lags_past_covariates或lags_future_covariates参数，这些滞后设置会同时应用于原始特征和编码特征，可能导致不必要的数据冗余或特征冲突。

解决方案

Darts提供了精细控制滞后特征生成的方法，允许开发者针对不同类型的特征分别设置滞后参数。具体实现方式如下：

1. 组件级滞后控制

通过将lags_past_covariates和lags_future_covariates参数从简单的列表或整数转换为字典，可以实现对不同特征组件的差异化滞后设置。

字典格式应包含：

default_lags：默认应用于所有特征的滞后设置
特定组件名称：针对该组件的特殊滞后设置

2. 编码器特征命名规则

Darts生成的编码特征遵循特定命名规则：

周期性编码器特征前缀为darts_enc_pc_cyc_
时间属性编码器特征前缀为darts_enc_pc_dta_

例如，小时周期的正弦编码特征名为darts_enc_pc_cyc_hour_sin，余弦编码特征名为darts_enc_pc_cyc_hour_cos。

3. 配置示例

model_params = {
    "lags": 12,
    "output_chunk_length": 12,
    "add_encoders": {
        "cyclic": {"past": ["hour"]},
        "datetime_attribute": {"past": ["hour"]}
    },
    "lags_past_covariates": {
        "darts_enc_pc_cyc_hour_sin": [-1],
        "darts_enc_pc_cyc_hour_cos": [-1],
        "default_lags": 10
    },
    "lags_future_covariates": {
        "default_lags": [1, 3, 6, 9, 12]
    }
}