5步精通贝叶斯优化：实验科学家的BoTorch实践指南

2026-04-02 09:20:40作者：鲍丁臣Ursa

问题引入：当传统优化方法遇到瓶颈

想象你正在优化一个化学反应过程——温度、压力、催化剂浓度等多个参数交织影响最终产率，每次实验需要等待8小时才能得到结果。如果采用网格搜索，即使每个参数仅测试3个水平，10个参数就意味着59049次实验，这在现实中根本不可行。

🔍 思考问题：如何在有限实验次数内找到最优参数组合？为什么随机搜索往往比网格搜索更高效？当评估成本极高时，我们需要怎样的智能策略来平衡"探索新区域"和"利用已知信息"？

贝叶斯优化正是为解决这类"黑盒函数优化"问题而生。它通过构建概率模型来指导搜索方向，在医药研发、材料科学、工业制造等领域有着广泛应用。BoTorch作为PyTorch生态下的贝叶斯优化库，将这一技术的实现门槛大幅降低。

核心原理：贝叶斯优化的工作智慧

从"盲人摸象"到"智能导航"

贝叶斯优化的核心思想可以类比为"有策略的寻宝游戏"：

每次探索后更新对"宝藏分布"的认知（概率模型）
基于当前认知决定下一步探索方向（采集函数）
逐步缩小搜索范围，最终定位宝藏位置（最优解）

📊 核心组件：

代理模型：用概率分布拟合未知函数（通常使用高斯过程）
采集函数：量化每个潜在点的探索价值
优化器：找到采集函数的最大值作为下一个评估点

贝叶斯优化的迭代过程：通过不断更新概率模型和选择新点，逐步逼近最优解

关键技术点解析

高斯过程回归：想象你在山区徒步，已知几个点的海拔，高斯过程就像一张地形图，不仅告诉你每个未知点的预估海拔，还给出这个预估的不确定性。这种"自带置信区间"的特性，正是贝叶斯优化的关键优势。

采集函数：这就像探险家用的"寻宝雷达"，综合考虑：

已知高点周围（ exploitation/利用）
地形剧烈变化区域（ exploration/探索）
不确定性高的区域（ uncertainty/不确定性）

技术拆解：BoTorch的模块化架构

核心模块交互流程

BoTorch采用模块化设计，主要包含五大核心组件：

[数据准备] → [模型构建] → [采集函数] → [优化器] → [结果分析]
     ↑                    ↓                    ↑
     └───────────────────┴────────────────────┘

模型模块（botorch/models/）：提供多种概率模型实现
- 基础应用：SingleTaskGP处理简单优化问题
- 高级技巧：使用HeterogeneousMTGP处理多任务场景
采集函数（botorch/acquisition/）：指导搜索方向
- 基础应用：ExpectedImprovement（期望改进）适合单目标优化
- 高级技巧：HypervolumeKnowledgeGradient处理多目标问题
优化器（botorch/optim/）：求解采集函数最大值
- 基础应用：optimize_acqf进行单次优化
- 高级技巧：使用homotopy优化处理复杂约束

技术选型决策树

面对具体问题时，如何选择合适的模型和采集函数？

问题类型 → 目标数量 → 约束条件 → 数据特性 → 推荐算法
单目标   → 无约束   → 少量数据   → 高斯过程 + 期望改进
多目标   → 有约束   → 大量数据   → 随机森林 + 帕累托采样

实践指南：实验设计优化案例

环境配置

🛠️ 基础安装：

pip install botorch

🛠️ GPU加速支持：

pip install botorch[gpytorch]

🛠️ 源码安装（开发版）：

git clone https://gitcode.com/gh_mirrors/bo/botorch
cd botorch
pip install -e .

实验设计优化实例

问题背景：某化工过程需要优化温度(50-150℃)、压力(1-5atm)和催化剂浓度(0.1-1.0mol/L)三个参数，目标是最大化产率(0-100%)。每次实验成本高、耗时长，最多只能进行20次实验。

实现步骤：

数据准备：

import torch
from botorch.utils.transforms import normalize, unnormalize

# 实验参数范围
bounds = torch.tensor([[50.0, 1.0, 0.1], [150.0, 5.0, 1.0]])
# 初始随机实验数据
train_X = normalize(torch.rand(5, 3), bounds=bounds)
train_Y = torch.tensor([[62.3], [78.1], [59.7], [82.4], [75.9]])  # 产率数据

构建高斯过程模型：

from botorch.models import SingleTaskGP
from botorch.fit import fit_gpytorch_model
from gpytorch.mlls import ExactMarginalLogLikelihood

model = SingleTaskGP(train_X, train_Y)
mll = ExactMarginalLogLikelihood(model.likelihood, model)
fit_gpytorch_model(mll)  # 训练模型

优化采集函数：

from botorch.acquisition import ExpectedImprovement
from botorch.optim import optimize_acqf

ei = ExpectedImprovement(model=model, best_f=train_Y.max())
candidate, _ = optimize_acqf(
    ei, bounds=torch.tensor([[0.0]*3, [1.0]*3]),  # 归一化空间
    q=1, num_restarts=10, raw_samples=100  # 优化参数
)
# 将建议点转换回原始空间
next_experiment = unnormalize(candidate, bounds=bounds)
print(f"下一次实验参数: {next_experiment}")