FlagEmbedding项目中关于MMarcoReranking任务评测的注意事项

2025-05-25 23:15:03作者：伍霜盼Ellen

Retrieval and Retrieval-augmented LLMs

项目地址：https://gitcode.com/GitHub_Trending/fl/FlagEmbedding

在使用FlagEmbedding项目进行MMarcoReranking任务评测时，开发者需要注意不同模型类型的适用性。近期有用户反馈使用bge-large-zh-v1.5模型在该任务上得到异常低的0.006分，这实际上是由于模型类型使用不当造成的技术问题。

模型类型区分的重要性

FlagEmbedding项目中的模型主要分为两类：嵌入模型(Embedding Model)和重排序模型(Reranker Model)。这两类模型在架构和使用方式上有本质区别：

嵌入模型：如bge-large-zh-v1.5，主要用于将文本转换为向量表示，适用于检索任务
重排序模型：如bge-reranker-large，专门用于对初步检索结果进行精细化排序

正确使用模型的方法

对于MMarcoReranking任务，必须使用专门的重排序模型。如果错误地将嵌入模型当作重排序模型使用，会导致评测结果异常低下。正确的做法是：

对于重排序任务，使用FlagReranker加载专门的reranker模型
对于嵌入模型，需要使用SentenceTransformer等专门处理嵌入的框架

性能优化建议

当使用SentenceTransformer加载大型嵌入模型时，可能会遇到性能问题。可以考虑以下优化措施：

启用FP16半精度计算
合理设置batch size
使用GPU加速
考虑模型量化等优化技术

评测脚本参考

项目提供了标准化的评测脚本，开发者应参考这些官方实现来确保评测过程的正确性。特别是对于中文多任务评测基准(C-MTEB)中的各项任务，需要严格区分不同模型类型的适用场景。

通过正确理解模型类型差异并采用合适的评测方法，开发者可以避免类似MMarcoReranking任务中出现的异常结果，获得准确可靠的模型性能评估。

Retrieval and Retrieval-augmented LLMs

项目地址：https://gitcode.com/GitHub_Trending/fl/FlagEmbedding

登录后查看全文

项目优选

收起

deepin linux kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

昇腾LLM分布式训练框架

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。