YOLO-World-v2-M预训练模型复现中的LVIS评估集差异解析

2025-06-07 08:08:59作者：魏献源Searcher

YOLO-World

项目地址：https://gitcode.com/gh_mirrors/yo/YOLO-World

在目标检测领域，YOLO-World项目因其出色的开放词汇检测能力而备受关注。近期有研究者在复现YOLO-World-v2-M预训练模型时，发现评估指标与官方报告存在差异，这实际上反映了LVIS数据集不同评估版本带来的影响。

问题背景

研究者在复现YOLO-World-v2-M预训练过程中，观察到最终日志文件中的LVIS bbox AP为23.5，而项目README中报告的AP_mini为30.0。这一差异并非复现错误，而是源于使用了LVIS数据集的不同评估子集。

LVIS数据集版本解析

LVIS数据集是大型词汇实例分割数据集，提供了两种主要评估子集：

minival：包含约5,000张图像的轻量级验证集，常用于快速验证模型性能
val v1.0：完整的验证集，包含约20,000张图像，评估结果更具统计意义

项目实现细节

YOLO-World项目在实际训练和公开配置中采用了不同的评估策略：

内部预训练时使用LVIS val v1.0进行评估，获得23.5 AP
公开的配置文件默认使用LVIS minival进行评估，报告30.0 AP_mini

这种差异是设计上的选择，而非实现错误。minival版本由于样本量较小，通常AP值会高于完整验证集。

技术建议

对于希望精确复现的研究者，建议：

明确区分不同评估集的结果
可根据需要修改配置文件中的评估集路径
完整评估时使用val v1.0，快速验证时使用minival
对比结果时应确保评估集一致

理解这一差异有助于研究者更准确地评估模型性能，并在不同实验设置间进行公平比较。这也反映了在实际研究中，评估指标的可比性依赖于一致的评估标准这一重要原则。

YOLO-World

项目地址：https://gitcode.com/gh_mirrors/yo/YOLO-World

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

leetcode

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.38 K

781

YOLO-World-v2-M预训练模型复现中的LVIS评估集差异解析

问题背景

LVIS数据集版本解析

项目实现细节

技术建议

热门内容推荐

最新内容推荐

项目优选

YOLO-World-v2-M预训练模型复现中的LVIS评估集差异解析

问题背景

LVIS数据集版本解析

项目实现细节

技术建议

相关内容推荐

热门内容推荐

最新内容推荐

项目优选