VLMEvalKit项目数据根目录配置方法解析

2025-07-03 05:45:54作者：段琳惟

在VLMEvalKit项目中，数据根目录的配置方式经历了重要变更。本文将详细介绍最新版本中的配置方法，帮助开发者快速上手项目配置。

数据根目录配置的演变

早期版本的VLMEvalKit项目中，开发者可以通过修改vlmeval/utils/dataset_config.py文件来配置数据根目录。但在最新版本中，该项目已经移除了这个配置文件，转而采用了更灵活的环境变量配置方式。

实际应用示例

以MMMU数据集为例，配置步骤如下：

设置环境变量：

export LMUData=/path/to/your/mmmu_data

运行评估命令：

torchrun --nproc-per-node=8 run.py --model your_model --data MMMU_DEV_VAL

执行后，VLMEvalKit会自动将MMMU数据集的tsv文件下载到指定的LMUData路径下。

最佳实践建议

对于团队协作项目，建议统一使用.env文件配置，便于版本控制和共享配置。
当需要同时处理多个不同位置的数据集时，可以采用混合策略：使用环境变量设置默认路径，再针对特定数据集修改其img_root属性。
注意检查目录权限，确保运行用户有对应目录的读写权限。

通过以上方法，开发者可以灵活地配置VLMEvalKit项目的数据存储位置，满足不同场景下的需求。这种设计既保持了配置的灵活性，又简化了项目结构，是项目架构优化的典型范例。

VLMEvalKit

Open-source evaluation toolkit of large multi-modality models (LMMs), support 220+ LMMs, 80+ benchmarks

项目地址：https://gitcode.com/gh_mirrors/vl/VLMEvalKit

登录后查看全文

项目优选

收起

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

495

520

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

作为 Ascend for PyTorch 社区的核心组件，TorchNPU 是昇腾专为 PyTorch 打造的深度学习适配插件，使 PyTorch 框架能够直接调用昇腾 NPU，为开发者提供昇腾 AI 处理器的超强算力。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

AscendNPU-IR是基于MLIR（Multi-Level Intermediate Representation）构建的，面向昇腾亲和算子编译时使用的中间表示，提供昇腾完备表达能力，通过编译优化提升昇腾AI处理器计算效率，支持通过生态框架使能昇腾AI处理器与深度调优

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。

Jupyter Notebook

659

298

VLMEvalKit项目数据根目录配置方法解析

数据根目录配置的演变

最新配置方法详解

方法一：使用环境变量

方法二：直接修改数据集类属性

实际应用示例

最佳实践建议

热门内容推荐

最新内容推荐

项目优选

VLMEvalKit项目数据根目录配置方法解析

数据根目录配置的演变

最新配置方法详解

方法一：使用环境变量

方法二：直接修改数据集类属性

实际应用示例

最佳实践建议

相关内容推荐

热门内容推荐

最新内容推荐

项目优选