FEDformer：革新时间序列预测的频率增强分解Transformer框架

2026-05-02 11:13:40作者：毕习沙Eudora

项目地址：https://gitcode.com/gh_mirrors/fe/FEDformer

时间序列预测是数据分析领域的关键任务，而FEDformer（频率增强分解Transformer）作为阿里巴巴团队在ICML 2022年提出的创新框架，通过将注意力机制迁移至频域，实现了线性复杂度，为长序列预测提供了高效解决方案。本文将全面介绍FEDformer的核心技术、安装配置、使用方法及最佳实践，助您快速掌握这一强大工具。

一、FEDformer技术优势解析

FEDformer在时间序列预测领域展现出显著优势，通过在六个基准数据集上的测试表明，相比现有先进方法，多元时间序列预测误差降低14.8%，单变量时间序列预测误差降低22.6%。其核心优势包括：

1.1 线性复杂度设计

传统Transformer在处理长序列时面临O(n²)的计算复杂度，而FEDformer通过频域注意力机制，将复杂度降至O(n)，极大提升了长序列预测的效率。

1.2 频率增强注意力机制

创新性地在频域执行注意力计算，有效捕捉时间序列的频率特征，提升预测精度。该机制使模型能更好地处理具有周期性和趋势性的数据。

1.3 双版本灵活选择

提供Fourier和Wavelets两个版本：

Fourier版本：适用于大多数通用时间序列预测场景
Wavelets版本：特别适合具有多尺度特征的复杂时间序列数据

1.4 模块化架构设计

框架采用清晰的模块化结构，各组件独立封装，便于用户根据需求进行定制和扩展，如添加新的注意力机制或调整频率变换方法。

二、环境配置与安装指南

2.1 系统要求

Python 3.8及以上版本
PyTorch 1.9.0深度学习框架

2.2 快速安装步骤

首先克隆项目仓库：

git clone https://gitcode.com/gh_mirrors/fe/FEDformer
cd FEDformer

然后安装所需依赖：

pip install -r requirements.txt

依赖包包括torch、pandas、einops等，完整列表可查看项目根目录下的requirements.txt文件。

三、快速上手：FEDformer使用指南

3.1 数据准备

FEDformer支持多个基准数据集，可从Autoformer或Informer项目获取，包括ETTh1、ETTh2、ETTm1、ETTm2等常用时间序列数据集。

3.2 一键运行预测任务

多元时间序列预测

bash ./scripts/run_M.sh

单变量时间序列预测

bash ./scripts/run_S.sh

四、项目架构与核心模块解析

4.1 整体架构

FEDformer采用编码器-解码器架构，主要由数据嵌入层、自相关层、频率相关模块等组件构成，协同完成时间序列的特征提取与预测。

4.2 核心模块介绍

数据嵌入层

layers/Embed.py实现了时间序列数据的嵌入处理，将原始序列转换为模型可处理的特征表示。

自相关层

layers/AutoCorrelation.py负责计算序列的自相关性，为注意力机制提供基础。

频率相关模块

Fourier相关模块：layers/FourierCorrelation.py
小波变换模块：layers/MultiWaveletCorrelation.py

这些模块实现了FEDformer的核心创新——在频域进行注意力计算，有效降低复杂度并提升性能。

模型实现

models/FEDformer.py包含FEDformer模型的完整实现，是整个框架的核心。

五、参数配置详解

5.1 基础配置参数

在run.py中可配置以下关键参数：

# 模型选择
parser.add_argument('--model', type=str, default='FEDformer',
                    help='模型名称，可选：[FEDformer, Autoformer, Informer, Transformer]')

# FEDformer版本选择
parser.add_argument('--version', type=str, default='Fourier',
                    help='FEDformer版本，可选：[Fourier, Wavelets]')

# 序列长度设置
parser.add_argument('--seq_len', type=int, default=96, help='输入序列长度')
parser.add_argument('--pred_len', type=int, default=96, help='预测序列长度')

5.2 数据配置选项

--features：指定预测任务类型
- M：多元预测多元
- S：单变量预测单变量
- MS：多元预测单变量

5.3 性能优化参数

--use_gpu：是否使用GPU加速（True/False）
--use_multi_gpu：是否使用多GPU（True/False）
--use_amp：是否启用自动混合精度训练（True/False）

六、实用技巧与最佳实践

6.1 版本选择策略

通用场景建议从Fourier版本开始尝试
若数据具有明显的多尺度特征，如同时包含日周期、周周期和月周期，建议使用Wavelets版本

6.2 频率模式选择

random模式：随机选择频率模式，适合大多数情况
low模式：选择低频模式，适合趋势性较强的时间序列

6.3 训练效率提升

适当调大--batch_size可加快训练速度
使用多GPU并行训练（需设置--use_multi_gpu True）
对于超长序列，可适当降低序列长度或使用滑动窗口技术

七、自定义开发指南

7.1 添加新数据集

修改数据工厂模块，添加自定义数据集的加载和预处理逻辑，即可支持新的数据源。

7.2 模型扩展方法

基于FEDformer的模块化设计，可以：

在layers/目录下添加新的注意力机制
修改频率变换方法，如尝试其他类型的傅里叶变换或小波变换
调整分解策略，优化频率分解效果

八、常见问题解答

Q: FEDformer与传统Transformer相比有什么优势？
A: FEDformer将注意力计算从时域迁移到频域，实现了线性复杂度，在长序列预测任务中效率更高，同时保持甚至提升了预测精度。

Q: 如何处理训练过程中的过拟合问题？
A: 可尝试增加正则化措施、使用早停策略、调整批大小或增加训练数据量。

Q: 模型预测效果不佳时该如何调优？
A: 建议尝试不同的版本（Fourier/Wavelets）、调整序列长度（seq_len/pred_len）、优化学习率或批量大小，以及检查数据预处理是否合理。

九、总结

FEDformer通过创新的频率增强分解Transformer架构，为时间序列预测领域带来了突破性进展。其线性复杂度设计和优秀的预测性能，使其成为处理长序列预测任务的理想选择。无论是学术研究还是工业应用，FEDformer都能提供可靠高效的时间序列预测能力。通过本文介绍的安装配置和使用指南，您可以快速上手并充分利用这一强大框架，解锁时间序列预测的新可能。

FEDformer

项目地址：https://gitcode.com/gh_mirrors/fe/FEDformer

登录后查看全文