Cognita项目中CrossEncoder在MPS设备上的兼容性问题解析
2025-06-16 14:25:47作者:裘晴惠Vivianne
问题背景
在Cognita项目的本地运行环境中,当用户尝试在配备Apple M1芯片的MacBook Air上执行检索增强生成(RAG)功能时,遇到了一个与Sentence Transformers库中CrossEncoder组件相关的设备兼容性问题。这个问题特别出现在使用macOS系统且具有MPS(Metal Performance Shaders)支持的苹果芯片设备上。
技术细节分析
CrossEncoder组件在初始化时会自动检测可用的最佳计算设备。在检测逻辑中,它会按照以下优先级选择设备:
- CUDA (NVIDIA GPU)
- MPS (苹果Metal)
- NPU (神经网络处理器)
- HPU (Habana处理器)
- CPU (最后回退选项)
在M1/M2芯片的Mac设备上,由于torch.backends.mps.is_available()返回True,CrossEncoder会优先选择MPS作为计算设备。然而,当使用Deberta-v2模型进行推理时,模型内部的相对位置编码计算会调用torch.sign()函数,而当前PyTorch的MPS后端尚未完善支持对int64类型数据的sign操作。
错误表现
具体错误表现为:
TypeError: Operation 'sign_out_mps()' does not support input type 'int64' in MPS backend.
这个错误发生在Deberta-v2模型的相对位置编码计算过程中,当尝试对int64类型的张量执行sign操作时,MPS后端无法处理。
解决方案
Cognita项目团队已经实施了以下解决方案:
-
强制回退机制:当CUDA不可用时,即使检测到MPS可用,也强制回退到CPU执行,确保兼容性。
-
未来改进方向:计划通过环境变量或运行时参数提供设备选择的灵活性,让用户能够根据实际情况指定计算设备。
开发者建议
对于在苹果芯片设备上开发类似应用的开发者,建议:
- 在模型初始化时显式指定设备类型,避免依赖自动检测
- 对于特定模型(如Deberta系列),优先考虑使用CPU执行
- 关注PyTorch对MPS后端的更新,随着版本迭代,这类兼容性问题可能会得到解决
总结
这个案例展示了在跨平台深度学习应用中设备兼容性的重要性。Cognita项目通过实施合理的回退机制,确保了应用在不同硬件环境下的稳定运行。这也提醒开发者,在支持多种计算设备时,需要充分考虑各后端的特性限制,并提供适当的回退方案。
登录后查看全文
热门项目推荐
相关项目推荐
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust0214
cann-learning-hubCANN 学习中心仓,支持在线互动运行、边学边练,提供教程、示例与优化方案,一站式助力昇腾开发者快速上手。Jupyter Notebook0138
uni-appA cross-platform framework using Vue.jsJavaScript08
GLM-5.2智谱开源 GLM-5.2,这是针对长文本任务的最新旗舰模型。相较于前代产品 GLM-5.1,它在长文本任务处理能力上实现了显著飞跃,并且首次在稳定的 100 万 token 上下文中提供这一能力。Jinja00
SwanLab⚡️SwanLab - an open-source, modern-design AI training tracking and visualization tool. Supports Cloud / Self-hosted use. Integrated with PyTorch / Transformers / LLaMA Factory / veRL/ Swift / Ultralytics / MMEngine / Keras etc.Python00
tiny-universe《大模型白盒子构建指南》:一个全手搓的Tiny-UniverseJupyter Notebook03
项目优选
收起
deepin linux kernel
C
32
16
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
469
465
暂无描述
Dockerfile
778
5.08 K
本项目是CANN提供的transformer类大模型算子库,实现网络在NPU上加速计算。
C++
877
2.03 K
Ascend Extension for PyTorch
Python
758
968
本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。
C++
697
1.4 K
昇腾LLM分布式训练框架
Python
185
231
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
1.1 K
1.14 K
本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本,由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用,3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。
Dart
1.04 K
271
JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent,它能够将大语言模型的强大能力,通过你日常使用的各类通讯应用,直接延伸至你的指尖。
Python
2.25 K
677