iTransformer项目中PatchTST模型性能差异的技术分析

2025-07-10 14:14:27作者：晏闻田Solitary

在时间序列预测领域，iTransformer项目作为基于Transformer架构的创新模型，其性能评估常常需要与其他先进模型进行对比。其中，PatchTST作为另一个基于Transformer的时间序列预测模型，在两篇不同论文中展现出了性能差异，这一现象值得深入探讨。

性能差异现象

通过对比iTransformer论文和原始PatchTST论文中的实验结果，可以观察到在Weather数据集上，PatchTST模型的预测性能存在明显差异。具体表现为在iTransformer论文中报告的PatchTST结果要差于原始论文中的表现。

经过技术验证和分析，这种性能差异主要源于两个研究采用了不同的实验设置：

输入长度设置不同：原始PatchTST论文中使用了336或512的较长输入序列长度，而iTransformer论文中统一采用了96的较短输入长度。这种输入长度的差异直接影响模型能够捕捉的时间依赖关系范围。
实验基准设置：iTransformer研究遵循了Informer和Autoformer等早期Transformer时间序列模型的实验设置，其中回看长度（lookback length）是固定不变的，没有进行调优。这种固定设置虽然增加了实验的可比性，但可能限制了模型的最佳表现。