VLMEvalKit项目云端模型API路径处理问题解析

2025-07-03 11:43:56作者：温玫谨Lighthearted

问题背景

在VLMEvalKit项目中，当用户尝试使用云端API模型（如硅基流动提供的模型）进行评测时，会遇到一个典型的路径处理问题。该问题主要出现在模型名称包含斜杠("/")字符的情况下，例如"deepseek-ai/deepseek-vl2"或"qvq/qvq-72b-preview"这类格式的模型名称。

问题现象

当用户配置使用这类包含斜杠的模型名称时，系统会尝试创建如下格式的输出文件路径：

{output_dir}/{model_name}/{model_name}_{dataset_name}_supp.pkl

例如对于模型"qvq/qvq-72b-preview"，系统会尝试创建：

output/qvq/qvq-72b-preview/qvq/qvq-72b-preview_vqa_supp.pkl

由于路径中包含多层目录结构，而系统没有预先创建这些目录，导致出现"AssertionError"错误，提示目录不存在。

技术分析

这个问题本质上是一个路径处理逻辑的设计缺陷。在VLMEvalKit项目中，模型名称被直接用作路径的一部分，而没有考虑模型名称中可能包含特殊字符（如斜杠）的情况。具体表现在：

路径拼接逻辑：系统直接将模型名称作为路径的一部分进行拼接，没有对特殊字符进行处理
目录创建机制：在尝试保存结果文件前，没有确保所有必要的父目录都存在
模型命名规范：云端API模型通常采用"厂商/模型名"的命名方式，这与本地文件路径的规范存在冲突

解决方案

针对这个问题，项目维护者提出了几种可行的解决方案：

自定义配置：建议用户通过自定义配置的方式，为这类模型创建专门的API配置项，避免直接使用原始模型名称
字符替换：可以考虑在路径处理时，将模型名称中的斜杠替换为其他字符（如下划线）
路径规范化：在处理模型名称时，先对名称进行规范化处理，确保不会产生无效的路径结构

最佳实践建议

对于需要使用云端API模型的开发者，建议采取以下实践：

参考项目中的SiliconFlowAPI和TeleMMAPI实现方式
为每个云端模型创建专门的配置项，而不是直接使用原始模型名称
在自定义API实现中，处理好模型名称与文件路径的转换关系
考虑在保存结果文件前，先检查并创建必要的目录结构

总结

这个问题展示了在实际开发中处理用户输入和系统路径时需要特别注意的边界情况。特别是在机器学习评测系统中，模型名称的多样性可能导致各种意外的路径问题。开发者在使用VLMEvalKit评测云端模型时，应当注意模型名称的特殊性，并采取适当的预防措施来避免这类路径处理错误。

VLMEvalKit

Open-source evaluation toolkit of large vision-language models (LVLMs), support GPT-4v, Gemini, QwenVLPlus, 50+ HF models, 20+ benchmarks

项目地址：https://gitcode.com/gh_mirrors/vl/VLMEvalKit

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

147

leetcode

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java