MTEB项目中的英语评测基准版本命名规范探讨

2025-07-01 02:25:43作者：殷蕙予

背景介绍

MTEB( Massive Text Embedding Benchmark)作为文本嵌入领域的重要评测基准，随着技术发展和需求变化，其英语评测基准的版本迭代需要建立清晰的命名规范。近期项目维护者针对英语评测基准的命名问题进行了深入讨论，旨在建立一套可扩展、易理解的版本命名体系。

现有命名问题分析

当前MTEB项目中存在两个英语评测基准：

MTEB(eng,classic) - 经典版本
MTEB(eng) - 新版本

这种命名方式存在以下问题：

缺乏明确的版本标识
未来版本迭代时命名可能混乱
无法直观体现版本演进关系

命名方案讨论

项目团队提出了两种主要命名方案：

方案A：版本号标识

将MTEB(eng,classic)重命名为MTEB(eng,v1)
将MTEB(eng)重命名为MTEB(eng,v2)
未来版本依次递增(v3,v4等)

方案B：年份标识

将MTEB(eng,classic)重命名为MTEB(eng,2022)
将MTEB(eng)重命名为MTEB(eng,2025)

经过讨论，团队更倾向于方案A，因为：

版本号标识更加通用，适用于所有语言基准
年份标识可能造成不一致性(如俄语基准没有年份)
版本号更易于扩展和维护

技术实现考量

在确定使用版本号标识方案后，团队还考虑了以下技术细节：

默认版本选择：建议将最新版本作为默认展示，同时提供历史版本链接
版本说明：每个基准应包含版本说明，明确版本间的差异
可访问性：基准名称应尽可能描述性，便于用户理解内容

最佳实践建议

基于讨论结果，建议采用以下命名规范：

所有基准采用"语言代码+版本号"格式(如MTEB(eng,v1))
最新版本作为默认展示版本
在基准描述中提供：
- 版本变更说明
- 历史版本链接
- 基准内容概述

这种命名方案具有以下优势：

清晰展示版本演进
易于未来扩展
保持命名一致性
便于用户理解和使用

总结

规范的版本命名对于评测基准的长期维护和使用至关重要。MTEB项目通过引入版本号标识方案，建立了清晰、可扩展的命名体系，为未来基准的迭代和发展奠定了良好基础。这一实践也为其他类似项目的版本管理提供了有益参考。

mteb

MTEB: Massive Text Embedding Benchmark

项目地址：https://gitcode.com/gh_mirrors/mt/mteb

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。