SentenceTransformers在多平台部署时的设备兼容性问题解决方案

2025-05-13 21:05:42作者：卓艾滢Kingsley

问题背景

在使用SentenceTransformers进行文本分类模型训练时，开发者可能会遇到跨平台部署时的设备兼容性问题。特别是在Mac M2芯片和Linux服务器之间迁移模型时，经常会出现运行时错误或段错误。

Mac到Linux迁移时的MPS错误
当在Mac M2上训练好的模型部署到Linux服务器时，会出现RuntimeError: torch.UntypedStorage(): Storage device not recognized: mps错误。这是因为Mac特有的Metal Performance Shaders(MPS)后端在Linux上不可用。
强制使用CPU时的段错误
当开发者尝试通过设置device='cpu'来规避MPS问题时，又可能遇到资源泄漏导致的段错误，表现为resource_tracker: There appear to be 1 leaked semaphore objects警告后程序崩溃。

这些问题的本质在于PyTorch在不同硬件平台上的后端实现差异：

在初始化SentenceTransformer时明确指定设备类型：

# 强制使用CPU
model = SentenceTransformer("sentence-transformers/all-MiniLM-L12-v2", device="cpu")

当遇到资源泄漏导致的段错误时，可以通过限制线程数来避免：

import torch
torch.set_num_threads(1)  # 限制为单线程

虽然这会降低编码速度，但能保证稳定性。

开发环境与生产环境一致
尽量保持开发和部署环境的一致性，特别是硬件架构和PyTorch版本。
模型保存时考虑跨平台
保存模型时可以使用torch.save(model.state_dict(), path)而非保存整个模型对象，这样加载时可以灵活选择设备。
环境隔离
使用虚拟环境或容器技术确保依赖版本一致。
性能与稳定性的权衡
在稳定性优先的场景下，牺牲部分性能换取可靠运行是合理的选择。