GLiNER项目：如何正确加载和使用微调后的本地模型

2025-07-06 23:36:38作者：胡易黎Nicole

在自然语言处理领域，GLiNER作为一个强大的实体识别框架，为用户提供了模型微调功能。然而，许多开发者在尝试加载本地微调后的模型时遇到了困难。本文将详细介绍如何正确加载和使用本地微调后的GLiNER模型。

常见问题分析

许多用户反馈，在尝试使用GLiNER.from_pretrained()方法加载本地微调模型时，会遇到各种错误，主要包括：

HFValidationError：当传递本地文件夹路径时，系统错误地将其视为HuggingFace仓库ID
RepositoryNotFoundError：系统尝试从HuggingFace Hub下载而非使用本地文件
路径格式问题：不同操作系统下的路径格式差异导致的加载失败

正确加载本地微调模型的方法

方法一：使用完整路径格式

确保使用正确的路径格式指向包含模型文件的目录：

model = GLiNER.from_pretrained("./training_logs/finetuned_99", local_files_only=True)

关键点：

路径应指向包含pytorch_model.bin和gliner_config.json的目录
必须设置local_files_only=True参数
使用相对路径时确保路径格式正确（"./"开头）

方法二：直接加载模型文件

如果上述方法无效，可以采用更底层的加载方式：

from gliner.model import load_config_as_namespace

# 定义模型文件路径
model_file = "logs/finetuned_2999/pytorch_model.bin"
config_file = "logs/finetuned_2999/gliner_config.json"

# 加载配置
config = load_config_as_namespace(config_file)
model = GLiNER(config)

# 加载模型权重
state_dict = torch.load(model_file, map_location="cpu")
model.load_state_dict(state_dict, strict=False, assign=True)
model.to("cpu")  # 或"cuda"如果使用GPU

这种方法完全绕过了HuggingFace的仓库验证机制，直接操作模型文件。

使用微调模型进行预测

加载模型后，可以像使用预训练模型一样进行实体识别：

text = "这是一段需要识别实体的文本"
labels = ["Facility", "Organization", "Person"]  # 你的自定义标签

entities = model.predict_entities(text, labels, threshold=0.5)
for entity in entities:
    print(f"识别到实体: {entity['text']} => {entity['label']}")