BoTorch项目中SAASBO模型对MPS设备的兼容性优化

2025-06-25 22:44:56作者：齐冠琰

项目地址：https://gitcode.com/gh_mirrors/bo/botorch

背景介绍

在机器学习领域，BoTorch作为基于PyTorch的贝叶斯优化库，为研究人员和开发者提供了强大的优化工具。近期，社区发现BoTorch中的SAASBO（Sparse Axis-Aligned Subspace Bayesian Optimization）模型在苹果MPS（Metal Performance Shaders）设备上运行时存在兼容性问题。

问题分析

MPS是苹果为加速Metal框架下的机器学习计算而设计的性能着色器。PyTorch对MPS的支持仍在不断完善中，目前存在两个主要限制：

数据类型限制：MPS设备不支持float64（双精度浮点）数据类型，仅支持float32（单精度浮点）
操作支持不完整：部分数学运算在MPS上尚未实现，需要回退到CPU执行

在SAASBO模型的实现中，qLogExpectedImprovement模块在注册缓冲区时显式使用了float类型，这会导致在MPS设备上运行时抛出类型错误。此外，Gamma分布采样等操作在MPS上尚未完全支持。

解决方案

开发团队通过以下方式解决了这些问题：

数据类型优化：
- 移除了显式的float类型声明，改为使用模型输入数据的默认类型
- 在运行时自动将数据转换为正确的类型和设备
操作兼容性处理：
- 对于MPS不支持的数学运算，通过设置环境变量允许回退到CPU执行
- 这种回退机制确保了代码的兼容性，但开发者需要注意性能影响

技术细节

在贝叶斯优化中，qLogExpectedImprovement是一个重要的采集函数，用于指导优化过程选择下一个评估点。该函数需要记录当前最优值（best_f）作为参考。原始实现中硬编码了float类型，这在MPS设备上会导致兼容性问题。

修改后的实现更加灵活：

不再强制指定数据类型
自动适应输入数据的类型
在必要时进行类型转换

这种改进不仅解决了MPS兼容性问题，也使代码更加健壮，能够适应不同的硬件环境。

实践建议

对于希望在MPS设备上使用BoTorch的开发者，建议：

确保使用最新版本的BoTorch
对于不支持的运算，可以设置环境变量启用CPU回退
注意单精度浮点可能带来的数值稳定性问题
监控性能表现，权衡MPS加速和CPU回退的影响

总结

BoTorch团队对SAASBO模型的这一改进，展示了框架对新兴硬件平台的快速适应能力。通过优化数据类型处理和运算兼容性，使这一强大的贝叶斯优化工具能够在苹果MPS设备上顺利运行。这种持续的技术演进对于保持开源机器学习工具的广泛可用性至关重要。

随着PyTorch对MPS支持的不断完善，我们可以期待BoTorch在这一平台上获得更好的性能和更全面的功能支持。开发者社区也应持续关注相关进展，以充分利用硬件加速带来的性能提升。

项目地址：https://gitcode.com/gh_mirrors/bo/botorch

登录后查看全文

热门内容推荐

1 【亲测免费】开源项目 `build-your-own-x` 使用指南 2 【亲测免费】探索科技之旅：《Build Your Own X》项目详解 3 GitHub_Trending/bu/build-your-own-x自动化：CI/CD流程在自制项目中的应用 4 从零打造智能家居系统：用build-your-own-x实现家庭自动化

最新内容推荐

Degrees of Lewdity中文汉化终极指南：零基础玩家必看的完整教程 Unity游戏翻译神器：XUnity Auto Translator 完整使用指南 PythonWin7终极指南：在Windows 7上轻松安装Python 3.9+终极macOS键盘定制指南：用Karabiner-Elements提升10倍效率 Pandas数据分析实战指南：从零基础到数据处理高手 Qwen3-235B-FP8震撼升级：256K上下文+22B激活参数 7步搞定机械键盘PCB设计：从零开始打造你的专属键盘终极WeMod专业版解锁指南：3步免费获取完整高级功能 DeepSeek-R1-Distill-Qwen-32B技术揭秘：小模型如何实现大模型性能突破音频修复终极指南：让每一段受损声音重获新生

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

昇腾LLM分布式训练框架

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

flutter_flutter

ohos_react_native

React Native鸿蒙化仓库

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力