Sentence Transformers安全升级：解决torch.load的weights_only警告问题

2025-05-13 07:54:51作者：昌雅子Ethen

在自然语言处理领域，Sentence Transformers作为基于Transformer架构的句子嵌入模型库，因其出色的性能和易用性而广受欢迎。近期，该库在模型加载过程中出现了一个值得关注的安全警告，本文将深入分析这一问题的技术背景、影响范围以及解决方案。

问题背景

当用户使用Sentence Transformers加载预训练模型时，系统会抛出关于torch.load函数的安全警告。这一警告源于PyTorch底层加载机制的安全考量——默认情况下，torch.load会以weights_only=False模式运行，这意味着它允许加载任意pickle数据并执行其中的代码。

从安全角度看，这种设计存在潜在风险。恶意构造的模型文件可能包含有害代码，在加载过程中被执行。PyTorch开发团队已经意识到这一问题，并计划在未来版本中将weights_only=True设为默认值，仅允许加载经过安全验证的模块。

技术原理

weights_only参数是PyTorch引入的一项重要安全特性。当设置为True时：

仅允许加载基本Python类型（如字典、列表等）
禁止执行任意代码
仅支持加载预定义的安全张量类型
提供可控的反序列化过程

这种限制虽然提高了安全性，但也意味着某些复杂的自定义对象可能无法加载。Sentence Transformers团队需要确保所有模型组件都能在这种受限环境下正常工作。

解决方案实现

Sentence Transformers团队在v3.1.0版本中全面集成了这一安全改进。主要变更包括：

修改Dense.py等核心模型文件中的加载逻辑
确保所有标准模型组件支持weights_only模式
保持向后兼容性，不影响现有模型的推理功能

用户只需通过简单的pip升级命令即可获得这一安全增强：

pip install -U sentence_transformers

升级建议

对于使用Sentence Transformers的开发者和研究人员，建议：

尽快升级到v3.1.0或更高版本
检查自定义模型组件是否兼容weights_only模式
关注PyTorch未来版本中相关默认值的变更
在CI/CD流程中加入安全加载测试

这一改进不仅提升了库的安全性，也为将来PyTorch的默认行为变更做好了准备，体现了Sentence Transformers团队对安全性和稳定性的重视。

总结

Sentence Transformers对torch.load安全警告的响应，展示了开源项目对安全问题的快速反应能力。通过及时集成weights_only参数支持，该库在保持原有功能的同时，显著提升了模型加载过程的安全性。这一改进对于处理敏感数据或部署在生产环境中的NLP应用尤为重要，建议所有用户尽快升级以获得最佳的安全保障。

sentence-transformers

State-of-the-Art Embeddings, Retrieval, and Reranking

项目地址：https://gitcode.com/gh_mirrors/se/sentence-transformers

登录后查看全文

Sentence Transformers安全升级：解决torch.load的weights_only警告问题

问题背景

技术原理

解决方案实现

升级建议

总结

项目优选