Darts项目中使用Ray Tune进行超参数优化的最新实践

2025-05-27 22:48:35作者：傅爽业Veleda

在时间序列预测领域，Darts是一个功能强大的Python库，它提供了多种预测模型和工具。其中，超参数优化是提升模型性能的重要环节。本文将详细介绍如何在Darts项目中利用最新版本的Ray Tune进行超参数优化。

Ray Tune API的演进

Ray Tune作为Ray生态系统中的超参数优化库，近年来经历了API的重大变化。从早期的tune.run()方法转变为现在推荐的tune.Tuner.fit()模式，这一变化带来了更清晰、更模块化的代码结构。

Darts与Ray Tune集成的新方法

在Darts中实现超参数优化时，我们需要构建一个可调用的目标函数。这个函数应该接收一个包含超参数的字典，并返回一个评估指标（如损失值）。以下是一个典型的目标函数结构：

def objective_fn(trial_params, target_series, past_covariates):
    # 从trial_params中提取超参数
    param1 = trial_params["param1"]
    param2 = trial_params["param2"]
    
    # 使用超参数创建和训练模型
    model = SomeDartsModel(param1=param1, param2=param2)
    model.fit(target_series, past_covariates=past_covariates)
    
    # 评估模型性能
    pred = model.predict(n=forecast_horizon)
    loss = mse(target_series[-forecast_horizon:], pred)
    
    return loss

配置搜索空间

Ray Tune提供了多种方式来定义超参数的搜索空间：

from ray import tune

search_space = {
    "learning_rate": tune.loguniform(1e-4, 1e-1),
    "batch_size": tune.choice([16, 32, 64]),
    "num_layers": tune.randint(1, 4),
    "hidden_size": tune.grid_search([32, 64, 128])
}

使用Tuner进行优化

新版Ray Tune的核心是Tuner类，它提供了更灵活的配置选项：

from ray.tune import Tuner
from ray.tune.schedulers import ASHAScheduler
from ray.tune.search import BayesOptSearch

# 配置搜索算法和调度器
algo = BayesOptSearch()
scheduler = ASHAScheduler()

tuner = Tuner(
    tune.with_parameters(objective_fn, 
                        target_series=target_series,
                        past_covariates=past_covariates),
    param_space=search_space,
    tune_config=tune.TuneConfig(
        metric="loss",
        mode="min",
        search_alg=algo,
        scheduler=scheduler,
        num_samples=50
    ),
    run_config=RunConfig(
        name="darts_hpo",
        stop={"training_iteration": 100}
    )
)

# 执行优化
results = tuner.fit()

结果分析与最佳参数获取

优化完成后，我们可以方便地获取和分析结果：

best_result = results.get_best_result(metric="loss", mode="min")
best_config = best_result.config
best_metrics = best_result.metrics

print(f"最佳配置: {best_config}")
print(f"最佳损失值: {best_metrics['loss']}")