Sentence-Transformers项目中CrossEncoder与Transformers最新版本的兼容性问题分析

2025-05-13 17:39:56作者：蔡丛锟

sentence-transformers

State-of-the-Art Embeddings, Retrieval, and Reranking

项目地址：https://gitcode.com/gh_mirrors/se/sentence-transformers

问题背景

在使用sentence-transformers库的CrossEncoder模块时，开发者发现当搭配最新版Transformers（4.47.0）时会出现模型加载失败的问题。具体表现为尝试加载"cross-encoder/ms-marco-MiniLM-L-6-v2"等预训练模型时，系统抛出OSError错误，提示无法找到模型文件。

问题根源

经过技术分析，这个问题源于Transformers 4.47.0版本中引入的多进程处理机制。当CrossEncoder尝试加载模型时，系统会通过多进程方式将原始的pytorch_model.bin文件转换为model.safetensors格式。这种转换过程在特定环境下（如M3 MacBook Pro）会出现异常，导致模型加载失败。

临时解决方案

对于遇到此问题的开发者，目前有两种可行的解决方案：

版本回退：将Transformers库降级到4.46.3版本，这是最直接的解决方法。
代码结构调整：将CrossEncoder的加载和使用代码放在if __name__ == "__main__":条件块中执行。这种结构可以避免多进程加载时可能出现的问题。

根本解决方案

项目维护者已经采取了以下措施从根本上解决这个问题：

为所有原始CrossEncoder模型添加了model.safetensors文件，这样系统就不需要再进行格式转换，直接从safetensors格式加载模型。
向Transformers项目提交了相关issue，推动底层问题的修复。

技术建议

对于深度学习开发者，在处理类似模型加载问题时，建议：

保持对依赖库版本变化的敏感性，特别是像Transformers这样核心的NLP库。
了解模型文件格式的发展趋势，如从传统的pytorch_model.bin向更安全的safetensors格式过渡。
掌握多进程环境下的Python代码编写规范，特别是模型加载这类资源密集型操作。

总结

这个案例展示了深度学习生态系统中库与库之间复杂的依赖关系。通过社区协作，sentence-transformers项目团队快速响应并解决了CrossEncoder与最新版Transformers的兼容性问题。对于开发者而言，理解这类问题的解决思路比记住具体解决方案更为重要。

sentence-transformers

State-of-the-Art Embeddings, Retrieval, and Reranking

项目地址：https://gitcode.com/gh_mirrors/se/sentence-transformers

登录后查看全文

项目优选

收起

deepin linux kernel

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

昇腾LLM分布式训练框架

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。