MTEB项目新排行榜模型缺失问题分析

2025-07-01 16:03:24作者：申梦珏Efrain

背景介绍

MTEB(大规模文本嵌入基准)项目近期更新了其排行榜系统，但在新系统中出现了模型数量大幅减少的情况。具体表现为：在mteb经典排行榜上，新系统仅显示108个模型，而旧系统则包含382个模型。这种显著的差异引起了项目贡献者和用户的关注。

通过对比新旧排行榜系统，可以观察到以下现象：

经过项目维护团队的调查，发现造成这种差异的主要原因包括：

模型元数据问题：部分模型缺乏必要的元数据信息，导致无法在新系统中正确显示。维护团队已经为大多数模型实现了元数据，但仍有一些模型存在信息缺失。
零样本测试限制：新系统对模型的零样本能力有更严格的要求，一些不符合这一标准的模型被排除在外。
结果文件问题：某些模型虽然存在于系统中，但由于结果文件缺失或存在问题，导致无法显示在排行榜上。
模型信息不透明：特别是中文排行榜中的部分模型，存在严重的信息缺失问题。例如：
- 某些模型在仓库中完全缺失
- 部分模型缺乏基本的README文档说明
- 一些模型的来源和训练方法完全未知

项目团队采取了以下措施来解决这些问题：

项目团队将继续：

MTEB项目排行榜的更新反映了对模型质量和透明度要求的提高。虽然短期内导致了模型数量的减少，但从长远来看，这将有助于建立更可靠、更具参考价值的基准系统。项目团队正在积极解决过渡期间出现的问题，并致力于为用户提供更准确、更全面的模型评估服务。

登录后查看全文