如何在离线环境中加载Sentence Transformers远程源码模型

2025-05-13 11:18:42作者：魏侃纯Zoe

背景介绍

在使用Sentence Transformers项目时，我们经常会遇到需要加载远程源码模型的情况。这类模型通常依赖于额外的Python代码文件来实现其特殊架构或功能。当工作环境没有互联网连接时，这种依赖关系就会带来挑战。

问题分析

以nomic-ai/nomic-embed-text-v1模型为例，该模型采用了远程源码的方式实现其特殊架构。在离线环境中直接加载会失败，因为系统无法获取到模型依赖的配置文件（如configuration_hf_nomic_bert.py）。这与传统的本地模型（如all-mpnet-base-v2）有明显区别。

解决方案详解

1. 预先下载模型文件

在有网络连接的环境中，首先需要完整下载模型及其所有依赖：

from sentence_transformers import SentenceTransformer

model = SentenceTransformer("nomic-ai/nomic-embed-text-v1", trust_remote_code=True)
model.save_pretrained("nomic-embed-text-v1-local")

这一步会创建一个包含模型权重和配置文件的本地目录。

2. 处理模型依赖

关键步骤是处理模型的auto_map配置：

检查生成的config.json文件
查找其中的auto_map字段，该字段定义了模型依赖的外部Python类
手动下载所有被引用的Python文件到本地模型目录

3. 修改配置文件

对于auto_map中形如"{repository}--{file}.{class}"的引用，需要简化为"{file}.{class}"格式。这是因为我们已经将所有依赖文件放在了本地目录中，不再需要从远程仓库加载。

4. 离线加载模型

完成上述准备后，即可在离线环境中加载模型：

embedding_model = SentenceTransformer(
    "nomic-embed-text-v1-local", 
    trust_remote_code=True,
    local_files_only=True,
)

技术细节

trust_remote_code参数在此场景下可能需要保留，因为它允许执行模型自带的Python代码。但在某些情况下，如果所有代码都已本地化，可能可以省略此参数。

最佳实践建议

对于需要离线使用的模型，建议提前在有网络的环境中测试完整的保存和加载流程
建立模型依赖文件的检查清单，确保所有必要文件都已本地化
考虑将处理好的离线模型包进行版本控制，便于团队共享和使用

总结

通过系统性地处理模型依赖关系，我们成功实现了Sentence Transformers远程源码模型在离线环境中的部署。这种方法不仅适用于nomic-ai/nomic-embed-text-v1模型，也可推广到其他类似架构的模型加载场景。

sentence-transformers

Multilingual Sentence & Image Embeddings with BERT

项目地址：https://gitcode.com/gh_mirrors/se/sentence-transformers

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。