Darts库中TFTModel加载检查点时QuantileRegression参数冲突问题解析

2025-05-27 09:29:09作者：乔或婵

问题背景

在使用Darts库的TFTModel进行时间序列预测时，许多开发者会遇到一个典型问题：当模型配置了自定义分位数范围(如[0.1, 0.5, 0.9])的QuantileRegression损失函数后，尝试从检查点(checkpoint)加载模型时会抛出类型错误。这个错误提示"cannot assign 'darts.utils.likelihood_models.QuantileRegression' as child module 'criterion'"，表明在模型加载过程中出现了参数配置冲突。

问题本质

经过深入分析，这个问题源于TFTModel中损失函数(loss_fn)和似然函数(likelihood)的互斥性设计原则。在Darts库的实现中：

损失函数(loss_fn)：用于训练过程中指导模型优化的目标函数
似然函数(likelihood)：用于概率预测时描述输出分布的函数

这两个参数在设计上是互斥的，开发者只能选择其中一种方式进行模型配置，而不能同时指定。当同时设置两者时，虽然训练过程可能正常进行，但在模型保存和加载时会出现兼容性问题。

解决方案

针对这个问题，开发者可以采取以下两种解决方案：

方案一：仅使用likelihood参数

这是官方推荐的做法，特别当需要进行概率预测时：

tft = TFTModel(
    # 其他参数...
    likelihood=QuantileRegression(quantiles=[0.1, 0.5, 0.9]),
    loss_fn=None,  # 显式设置为None
    # 其他参数...
)

方案二：仅使用loss_fn参数

如果不需要概率预测，仅需确定性预测：

tft = TFTModel(
    # 其他参数...
    loss_fn=QuantileRegression(quantiles=[0.1, 0.5, 0.9]),
    likelihood=None,  # 显式设置为None
    # 其他参数...
)

最佳实践建议

明确预测需求：先确定是需要概率预测还是确定性预测，再选择相应配置
参数一致性：训练和加载时保持相同的参数配置
显式设置：即使使用默认值，也建议显式设置None以提高代码可读性
版本兼容性：注意不同Darts版本间API的变化

技术原理延伸

Darts库的这种设计源于深度学习模型训练和预测阶段的差异：

训练阶段：需要明确的损失函数指导优化
预测阶段：可能需要不同的输出形式(点预测/概率预测)

通过分离loss_fn和likelihood，Darts提供了更灵活的建模方式。理解这一设计理念有助于开发者更好地使用TFTModel及其他概率预测模型。

darts

A python library for user-friendly forecasting and anomaly detection on time series.

项目地址：https://gitcode.com/gh_mirrors/da/darts

登录后查看全文

项目优选

收起

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本仓将收集和展示高质量的仓颉示例代码，欢迎大家投稿，让全世界看到您的妙趣设计，也让更多人通过您的编码理解和喜爱仓颉语言。

830

6.18 K

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

AtomGit CLI （ag cli），AtomGit 命令行工具，参考 GitHub CLI (gh) 开发。目前 atomgit-cli 项目已在 AtomCode 的 Coding Plan 项目列表中

cann-learning-hub

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。