OpenVINO Notebooks中Llava多模态聊天机器人模型运行问题解析

2025-06-28 12:56:09作者：咎竹峻Karen

问题背景

在使用OpenVINO Notebooks项目中的llava-multimodal-chatbot-genai.ipynb笔记本时，开发者遇到了两个主要的技术问题：

模型文件缺失问题：在运行INT4量化版本的Llava-1.5-7B模型时，系统提示缺少openvino_tokenizer.xml文件，导致模型无法正常加载。
模型推理准确性问题：即使解决了文件缺失问题后，模型给出的回答与预期不符，显示出预处理环节可能存在缺陷。

该问题的根本原因在于模型转换过程中未能正确生成所有必需的文件。具体表现为：

解决方案是重新执行模型转换命令，确保转换过程完整完成。值得注意的是，这一转换过程对系统资源要求较高：

第二个问题更为复杂，涉及模型预处理环节的缺陷：

对于文件缺失问题：

对于推理准确性问题：

OpenVINO Notebooks中的Llava多模态聊天机器人示例展示了如何将先进的视觉语言模型部署到Intel硬件平台。通过解决文件缺失和预处理问题，开发者可以充分利用OpenVINO的优化能力，实现高效的本地多模态AI应用部署。这一过程也凸显了模型转换和预处理环节在AI部署中的重要性。

登录后查看全文