iTransformer项目中验证阶段设备转移的技术细节解析

2025-07-10 08:10:29作者：袁立春Spencer

在深度学习模型训练过程中，数据在不同计算设备（如CPU和GPU）之间的转移是一个常见但容易被忽视的技术细节。本文将以iTransformer项目中的exp_long_term_forecasting.py实现为例，深入分析验证阶段数据处理的最佳实践。

验证阶段的数据处理策略

在iTransformer的长期预测任务实现中，验证阶段的数据处理采用了与训练阶段不同的设备管理策略。具体表现为：在验证阶段，目标值batch_y保留在CPU上，而时间标记batch_y_mark则被转移到指定设备（通常是GPU）。这种设计选择背后有着合理的工程考量。

技术实现原理

验证阶段不将目标值转移到GPU的主要原因包括：

计算效率优化：验证阶段仅需要前向传播计算预测值，不需要计算梯度或进行反向传播。目标值仅用于计算评估指标，这部分计算通常在CPU上完成更为高效。
内存管理：GPU内存是宝贵资源，验证数据通常比训练数据更大（特别是长序列预测任务）。将不必要的数据保留在CPU上可以显著减少GPU内存占用。
评估指标计算：大多数评估指标（如MSE、MAE等）的计算在CPU上完成已经足够高效，转移到GPU反而可能增加不必要的设备间数据传输开销。

工程实践建议

基于iTransformer的这一实现细节，我们可以总结出以下深度学习工程实践建议：

设备转移的精确控制：只将确实需要在设备上计算的数据进行转移，避免不必要的设备间数据传输。
验证/测试阶段优化：在这些阶段可以适当放松设备一致性要求，以换取更好的内存利用率和计算效率。
代码可维护性：虽然功能上不影响结果，但保持代码风格一致有助于长期维护。这也是为什么iTransformer后续修复了这个"不一致"的问题。

对模型性能的影响

值得注意的是，这种设备管理策略对模型的实际预测性能没有任何影响。它仅涉及计算资源的优化分配，不会改变模型的计算逻辑或预测结果。这种优化在大型模型或大数据集场景下尤为重要，可以显著减少验证阶段的内存占用和计算时间。

总结

iTransformer项目中的这一实现细节展示了深度学习工程中设备管理的精妙之处。理解这些看似微小的技术选择，对于开发高效、可扩展的深度学习系统至关重要。这也提醒我们，在模型开发过程中，不仅要关注算法创新，也要重视这些工程实现细节的优化。

iTransformer

Official implementation for "iTransformer: Inverted Transformers Are Effective for Time Series Forecasting" (ICLR 2024 Spotlight)

项目地址：https://gitcode.com/gh_mirrors/it/iTransformer

登录后查看全文

项目优选

收起

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

458

446

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

Python

152

255