YOLO-World项目中的LVIS零样本评估结果差异解析

2025-06-07 20:19:32作者：尤辰城Agatha

项目地址：https://gitcode.com/gh_mirrors/yo/YOLO-World

在YOLO-World目标检测项目中，研究人员发现官方README文档与论文表2中报告的LVIS数据集零样本评估结果存在差异。经过深入分析，这种差异主要源于评估设置的不同。

论文表2中展示的结果采用了特定的评估配置：将max_per_img参数设置为1000，并使用了固定AP（Average Precision）的计算方法。这种评估方式参考了大型词汇目标检测领域的标准实践，能够更全面地反映模型在开放词汇场景下的性能表现。

相比之下，项目仓库README文档中报告的结果则是基于更基础的测试设置。这种设置更接近常规目标检测模型的评估流程，没有对检测数量上限和AP计算进行特殊调整。值得注意的是，当前仓库提供的模型检查点在实际测试中表现优于论文报告结果，这可能是由于后续优化带来的性能提升。

对于希望在COCO数据集上微调YOLO-World模型的研究人员，可以使用仓库README中提供的检查点作为预训练权重。项目团队已经发布了专门的微调配置文件，并承诺将在近期更新微调设置以获得更好的性能表现。

这一发现提醒我们，在比较不同来源的模型性能时，必须关注评估配置的细节差异。研究人员在实际应用中应当根据需求选择合适的评估标准，并注意不同版本模型间的性能变化。

YOLO-World

项目地址：https://gitcode.com/gh_mirrors/yo/YOLO-World

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

leetcode

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.37 K

781