Optimum项目中的ONNX模型导出与特征提取问题解析

2025-06-28 22:08:18作者：郁楠烈Hubert

背景介绍

在自然语言处理领域，将预训练模型转换为ONNX格式并进行优化是提高推理效率的常见做法。Optimum作为Hugging Face生态系统中的重要组件，专门用于优化和加速Transformer模型的推理过程。然而，在实际应用中，开发者可能会遇到一些技术挑战。

当开发者尝试使用Optimum工具将BGE-base-zh中文模型导出为ONNX格式并进行特征提取时，可能会遇到两个关键错误：

输入名称不匹配错误：系统提示"Invalid Feed Input Name:token_type_ids"，表明ONNX模型期望的输入名称与实际提供的输入不匹配。
输出键缺失错误：系统抛出KeyError: 'last_hidden_state'异常，说明模型输出中缺少预期的"last_hidden_state"键。

第一个错误通常发生在模型转换过程中，当原始PyTorch模型与ONNX导出配置之间存在不匹配时。特别是对于某些BERT变体模型，token_type_ids可能不是必需的输入参数，但在导出过程中被错误地包含。

第二个错误更为复杂，涉及模型架构与预期输出的不匹配。在标准的Transformer架构中，"last_hidden_state"是模型的主要输出之一，包含序列中每个token的上下文表示。当这个键缺失时，通常意味着：

针对这些问题，社区贡献者提出了有效的修复方案：

模型转换和优化是深度学习部署流程中的关键环节，Optimum项目为这一过程提供了强大支持。通过理解这些常见问题的根源和解决方案，开发者可以更高效地完成模型部署工作，充分发挥ONNX格式在推理性能上的优势。

登录后查看全文