Botorch中风险规避多目标优化问题的解决方案

2025-06-25 23:14:38作者：尤峻淳Whitney

botorch

项目地址：https://gitcode.com/gh_mirrors/bo/botorch

概述

在实验优化领域，我们经常遇到目标函数存在随机性的情况。本文探讨了如何使用Botorch框架实现风险规避的多目标优化，特别是在实验室环境中，当实验结果存在随机性时，如何避免采样噪声较大的区域。

问题背景

在实验室环境中进行优化时，实验结果往往存在随机性。我们可以通过重复实验来评估这种随机性，但传统的优化方法可能会忽略这种随机性，导致在噪声较大的区域进行不必要的采样。我们需要一种能够同时考虑目标函数期望值和方差的风险规避优化方法。

现有方法分析

直接建模方法

一种直观的方法是直接对Y_mean - β*Y_std进行建模：

计算重复实验的均值(Y_mean)和标准差(Y_std)
构建目标函数为Y_mean - β*Y_std
使用qLogNEHVI进行优化

这种方法简单直接，但可能无法充分利用数据中的信息，特别是当Y_mean和Y_std之间存在复杂关系时。

异方差GP建模方法

更高级的方法是使用异方差高斯过程(Heteroskedastic GP)分别建模Y_mean和Y_std：

使用HeteroskedasticSingleTaskGP分别拟合Y_mean和Y_std
在后验采样时考虑观测噪声(observation_noise=True)
应用GenericMCMultiOutputObjective对采样结果进行处理

这种方法能够更好地捕捉Y_mean和Y_std之间的关系，但实现上更为复杂。

技术实现细节

模型构建

from botorch.models.gp_regression import HeteroskedasticSingleTaskGP
from gpytorch.mlls.exact_marginal_log_likelihood import ExactMarginalLogLikelihood

def train_model(train_X, train_Y):
    model = HeteroskedasticSingleTaskGP(
        train_X=train_X,
        train_Y=train_Y
    )
    mll = ExactMarginalLogLikelihood(model.likelihood, model)
    fit_gpytorch_mll(mll, max_retries=5)
    return model

风险规避目标函数

from botorch.acquisition.multi_objective.objective import GenericMCMultiOutputObjective

def risk_averse_objective(samples):
    # samples shape: (n_samples, n_points, n_objectives)
    return samples.mean(dim=0) - beta * samples.std(dim=0)

objective = GenericMCMultiOutputObjective(risk_averse_objective)

优化过程

from botorch.acquisition.multi_objective.logei import qLogNoisyExpectedHypervolumeImprovement
from botorch.optim import optimize_acqf

acq_func = qLogNoisyExpectedHypervolumeImprovement(
    model=model,
    ref_point=ref_point,
    objective=objective,
    X_baseline=train_X,
    sampler=sampler,
    observation_noise=True  # 关键参数
)

X_cand, _ = optimize_acqf(
    acq_function=acq_func,
    bounds=bounds,
    q=batch_size,
    num_restarts=NUM_RESTARTS,
    raw_samples=RAW_SAMPLES
)