GLiNER项目在MPS设备上的微调问题与解决方案

2025-07-05 22:41:04作者：裘晴惠Vivianne

Generalist and Lightweight Model for Named Entity Recognition (Extract any entity types from texts)

项目地址：https://gitcode.com/gh_mirrors/gl/GLiNER

背景介绍

GLiNER是一个基于Transformer架构的命名实体识别(NER)模型，它能够高效地从文本中提取结构化信息。在实际应用中，开发者经常需要对预训练模型进行微调(fine-tuning)以适应特定领域的任务需求。对于使用Apple Silicon芯片(M1/M2)的开发者来说，利用Metal Performance Shaders(MPS)进行加速是一个理想选择。

问题现象

在尝试使用MPS设备对GLiNER模型进行微调时，开发者遇到了一个典型错误："Placeholder storage has not been allocated on MPS device!"，随后是更具体的错误信息："Calculated loss must be on the original device: cpu but device in use is mps:0"。

这个错误表明系统在尝试将计算从CPU转移到MPS设备时出现了问题，具体表现为损失值计算设备不匹配。

问题分析

通过深入分析，我们发现这个问题主要涉及以下几个方面：

设备管理冲突：当开发者显式设置设备为MPS时，Hugging Face的Trainer类内部可能有自己的设备管理逻辑，导致冲突。
Transformers版本兼容性：在较新版本的Transformers库(如4.42)中，对MPS设备的支持可能存在一些问题，特别是与损失计算相关的部分。
自动设备分配：GLiNER和Transformers库都有自己的设备自动检测和分配机制，多重管理可能导致意外行为。

解决方案

经过多次测试和验证，我们找到了以下有效的解决方案：

避免手动设置设备：不要显式调用model.to(device)或设置设备变量，让Trainer自动处理设备分配。
使用兼容的Transformers版本：将Transformers库降级到4.41版本可以解决这个问题。这个版本对MPS设备的支持更加稳定。
确保数据加载正确：使用GLiNER提供的专用数据集类GLiNERDataset来封装训练数据，确保数据格式与模型预期一致。

最佳实践建议

对于希望在Apple Silicon设备上微调GLiNER模型的开发者，我们建议：

创建干净的Python环境，专门安装兼容版本的库：
```
transformers==4.41.0
torch>=2.0.0
```
遵循GLiNER官方提供的训练脚本结构，避免不必要的设备设置代码。
监控训练过程中的设备使用情况，确保计算确实发生在MPS设备上。
对于大型数据集，考虑使用较小的批次大小(batch size)以避免内存问题。

技术原理

MPS是Apple提供的Metal Performance Shaders框架，它允许开发者充分利用Apple Silicon芯片的GPU能力。与CUDA类似，MPS为PyTorch提供了后端支持，使得在Mac设备上也能高效地进行深度学习训练。

在底层实现上，当PyTorch检测到MPS可用时，会自动将张量运算分配到MPS设备。然而，当多个组件(如模型、训练器、数据加载器等)各自尝试管理设备时，就可能出现冲突。Transformers库4.41版本在这方面提供了更稳定的实现。

总结

在Apple Silicon设备上使用MPS加速GLiNER模型的微调是完全可行的，关键在于使用兼容的库版本和正确的配置方法。通过本文介绍的方法，开发者可以顺利地在M1/M2芯片上高效地进行模型微调，充分利用硬件加速能力。

随着PyTorch和Transformers对MPS支持的不断完善，未来在Mac设备上进行深度学习开发将会变得更加顺畅。开发者应关注官方文档和版本更新，以获取最新的兼容性信息。

Generalist and Lightweight Model for Named Entity Recognition (Extract any entity types from texts)

项目地址：https://gitcode.com/gh_mirrors/gl/GLiNER

登录后查看全文

热门内容推荐

1 编程实践项目探索指南：从零构建技术能力体系 2 技术解构式学习：从0到1构建你的编程知识体系 3 构建自己的技术世界：build-your-own-x项目的实践探索指南 4 解锁编程技能的实践之旅：从零构建你的技术世界 5 技术实践探索：从零开始构建核心系统的实践指南 6 亲手锻造技术引擎：从0到1构建核心系统的实践指南

最新内容推荐

AcFunDown视频下载工具完全指南还在为数字笔记抓狂？这款开源神器让手写批注效率提升300%Windows笔记本电池健康管理全指南：从根源解决电池损耗问题 gmx_MMPBSA分子间相互作用索引错误的深度诊断与解决 Axure RP 11 本地化方案：Mac中文界面优化与原型设计工具汉化全指南如何高效获取教育资源？这款工具让教材下载效率提升80%视频元数据深度编辑：专业技巧与案例网盘直链下载技术解析与应用指南如何用DeepSeek-R1推理模型提升复杂任务解决能力：完整指南 5个突破瓶颈技巧：硬件优化工具让你的电脑性能提升30%

项目优选

收起

deepin linux kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

昇腾LLM分布式训练框架

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。