Olive项目中Whisper-medium模型转换失败问题解析

2025-07-07 00:58:33作者：贡沫苏Truman

问题背景

在使用微软Olive项目优化Whisper-medium语音识别模型时，部分用户遇到了模型转换失败的问题。具体表现为在运行转换工作流时，系统抛出"InvalidProtobuf"错误，提示ONNX模型文件解析失败。这一问题主要出现在Windows系统环境下，且在使用Python 3.11及以上版本时更为常见。

错误现象

当用户尝试通过Olive工作流转换Whisper-medium模型时，转换过程会在"transformers_optimization"阶段失败。错误日志显示系统无法正确解析生成的ONNX模型文件，具体报错信息为"Protobuf parsing failed"。这一错误发生在模型优化阶段，表明生成的中间ONNX文件可能存在问题。

问题根源

经过技术分析，该问题主要由以下几个因素导致：

模型大小问题：Whisper-medium作为中等规模的语音识别模型，其生成的ONNX文件体积较大，超过了常规处理的范围。
Python版本兼容性：在Python 3.11及以上版本中，Protobuf库的行为有所变化，对大型模型文件的处理更为严格。
内存限制：默认配置下，Olive尝试将整个模型加载到内存中进行处理，对于大型模型可能导致资源不足。

解决方案

针对这一问题，微软Olive团队提供了以下解决方案：

启用外部数据存储：在OnnxConversion配置中添加"save_as_external_data": true参数，将大型模型参数存储在外部文件中，避免内存问题。
降级Python版本：对于暂时无法修改配置的用户，可以暂时使用Python 3.10或以下版本运行工作流。
清理缓存：建议在每次运行前清理缓存目录，避免使用可能已损坏的缓存模型。