Chronos-forecasting项目中的ETTh数据集微调问题解析

2025-06-25 02:04:39作者：盛欣凯Ernestine

引言

在时间序列预测领域，Chronos-forecasting项目作为亚马逊科学团队推出的重要工具，提供了基于Transformer架构的预训练模型。本文将深入探讨在使用Chronos-t5-small模型对ETTh数据集进行微调时遇到的性能下降问题及其解决方案。

研究人员在使用Chronos-t5-small模型对ETTh1和ETTh2数据集进行微调时，发现微调后的模型性能反而低于零样本（zeroshot）性能。具体表现为：

这种性能下降现象与预期相反，通常我们期望微调能够提升模型在特定数据集上的表现。

Chronos模型采用T5架构，通过将时间序列离散化为token进行处理。模型训练时使用MeanScaleUniformBins分词器，将连续值映射到4096个离散区间。这种设计使模型能够处理各种规模的时间序列数据。

经过深入调查，发现性能下降主要由以下因素导致：

通过调整以下参数，成功解决了性能下降问题：

对于希望在Chronos模型上进行微调的研究人员，建议：

Chronos模型作为强大的时间序列预测工具，其微调过程需要谨慎的参数配置。通过合理调整学习率和预测长度等关键参数，可以有效提升模型在特定数据集上的表现。这一经验不仅适用于ETTh数据集，也可推广到其他时间序列预测任务的微调过程中。

对于时间序列预测领域的研究人员和工程师，理解模型微调的内在机制和关键参数影响，是获得良好预测性能的重要前提。Chronos项目为这一领域提供了强大的基础模型，但如何针对特定任务进行优化，仍需结合领域知识和实验验证。

登录后查看全文