Cognita项目中CrossEncoder在MPS设备上的兼容性问题解析

2025-06-16 16:37:35作者：裘晴惠Vivianne

问题背景

在Cognita项目的本地运行环境中，当用户尝试在配备Apple M1芯片的MacBook Air上执行检索增强生成(RAG)功能时，遇到了一个与Sentence Transformers库中CrossEncoder组件相关的设备兼容性问题。这个问题特别出现在使用macOS系统且具有MPS(Metal Performance Shaders)支持的苹果芯片设备上。

技术细节分析

CrossEncoder组件在初始化时会自动检测可用的最佳计算设备。在检测逻辑中，它会按照以下优先级选择设备：

CUDA (NVIDIA GPU)
MPS (苹果Metal)
NPU (神经网络处理器)
HPU (Habana处理器)
CPU (最后回退选项)

在M1/M2芯片的Mac设备上，由于torch.backends.mps.is_available()返回True，CrossEncoder会优先选择MPS作为计算设备。然而，当使用Deberta-v2模型进行推理时，模型内部的相对位置编码计算会调用torch.sign()函数，而当前PyTorch的MPS后端尚未完善支持对int64类型数据的sign操作。

错误表现

具体错误表现为：

TypeError: Operation 'sign_out_mps()' does not support input type 'int64' in MPS backend.

这个错误发生在Deberta-v2模型的相对位置编码计算过程中，当尝试对int64类型的张量执行sign操作时，MPS后端无法处理。

解决方案

Cognita项目团队已经实施了以下解决方案：

强制回退机制：当CUDA不可用时，即使检测到MPS可用，也强制回退到CPU执行，确保兼容性。
未来改进方向：计划通过环境变量或运行时参数提供设备选择的灵活性，让用户能够根据实际情况指定计算设备。

开发者建议

对于在苹果芯片设备上开发类似应用的开发者，建议：

在模型初始化时显式指定设备类型，避免依赖自动检测
对于特定模型(如Deberta系列)，优先考虑使用CPU执行
关注PyTorch对MPS后端的更新，随着版本迭代，这类兼容性问题可能会得到解决

总结

这个案例展示了在跨平台深度学习应用中设备兼容性的重要性。Cognita项目通过实施合理的回退机制，确保了应用在不同硬件环境下的稳定运行。这也提醒开发者，在支持多种计算设备时，需要充分考虑各后端的特性限制，并提供适当的回退方案。

cognita

RAG (Retrieval Augmented Generation) Framework for building modular, open source applications for production by TrueFoundry

项目地址：https://gitcode.com/GitHub_Trending/co/cognita

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。