VLMEvalKit项目：如何生成OpenVLM.json评估结果文件

2025-07-03 20:51:24作者：仰钰奇

在开源多模态大模型评估框架VLMEvalKit中，OpenVLM.json文件是记录模型评估结果的核心文件。本文将详细介绍如何生成这个JSON格式的评估结果文件，帮助研究人员和开发者将自己的模型评估结果整合到项目官方排行榜中。

OpenVLM.json文件的作用

OpenVLM.json文件是VLMEvalKit项目中用于汇总各种视觉语言模型(VLM)评估结果的标准化格式文件。该文件包含了模型的基本元信息以及在多个基准测试集上的性能表现，是项目排行榜的数据来源。

文件生成方法

要生成符合规范的OpenVLM.json文件，需要遵循以下步骤：

评估模型性能：首先使用VLMEvalKit工具包对目标模型进行评估，获得各基准测试集上的结果。
准备结果数据：将评估结果整理为JSON格式，包含两个主要部分：
- META部分：记录模型的基本信息
- 评估结果部分：记录各测试集上的具体表现
文件格式规范：JSON文件应采用如下结构：

{
    "模型名称": {
        "META": {
            "Method": ["模型名称", "模型网址"],
            "Parameters": "参数量",
            "Language Model": "使用的语言模型",
            "Vision Model": "使用的视觉模型",
            "Org": "所属机构",
            "Time": "评估日期",
            "Verified": "是否验证",
            "OpenSource": "是否开源"
        },
        "SEEDBench_IMG": {
            // 测试集结果详情
        }
        // 其他测试集结果...
    }
}

注意事项

不需要包含所有模型的评估结果，只需提供您要添加的新模型数据。
提交的模型必须能够被VLMEvalKit工具包支持。
项目维护团队会审核提交的结果，验证通过后才会合并到官方排行榜。

最佳实践建议

建议将生成脚本放在项目的scripts目录下，与其他工具脚本保持统一。
随着项目支持的评估数据集增加，应及时更新生成脚本以兼容新数据集。
对于开源贡献，建议通过GitHub提交Pull Request，包含评估结果和生成脚本。

通过遵循上述规范，研究人员可以方便地将自己的模型评估结果整合到VLMEvalKit项目的统一评估体系中，促进多模态大模型领域的透明比较和技术进步。

VLMEvalKit

Open-source evaluation toolkit of large multi-modality models (LMMs), support 220+ LMMs, 80+ benchmarks

项目地址：https://gitcode.com/gh_mirrors/vl/VLMEvalKit

登录后查看全文

VLMEvalKit项目：如何生成OpenVLM.json评估结果文件

OpenVLM.json文件的作用

文件生成方法

注意事项

最佳实践建议

项目优选