Qdrant混合搜索中的分数计算机制解析

2025-05-08 11:54:33作者：虞亚竹Luna

Qdrant - High-performance, massive-scale Vector Database and Vector Search Engine for the next generation of AI. Also available in the cloud https://cloud.qdrant.io/

项目地址：https://gitcode.com/GitHub_Trending/qd/qdrant

在Qdrant向量数据库的1.12.1版本中，用户反馈了一个关于混合搜索分数计算的疑问。本文将深入剖析Qdrant混合搜索的底层机制，帮助开发者正确理解和使用这一功能。

混合搜索的基本原理

Qdrant支持同时处理稀疏向量和稠密向量的混合搜索。这两种向量类型在内部采用不同的相似度计算方式：

稀疏向量：默认使用点积（Dot Product）计算相似度
稠密向量：可配置为欧式距离（Euclidean）或余弦相似度（Cosine）等度量方式

RRF融合算法的工作机制

当使用RRF（Reciprocal Rank Fusion）进行结果融合时，系统会基于以下原则工作：

排序优先：RRF算法完全依赖结果排序位置，不考虑原始相似度分数
分数计算：采用公式score = 1 / (position + 2.0)为每个结果计算新分数
累积机制：如果一个点在两种向量搜索结果中都出现，其分数会累积

实际应用建议

开发者在使用混合搜索时需要注意：

明确区分查询向量类型：确保稀疏向量和稠密向量分别对应正确的字段
理解RRF特性：当使用RRF融合时，原始相似度分数会被覆盖
结果解读：最终结果按融合后的新分数排序，直接取TopN即可

技术细节补充

对于需要精确控制相似度计算的场景，建议：

单独执行稀疏或稠密向量搜索来获取原始相似度分数
考虑使用加权融合而非RRF，当需要保留原始相似度信息时
注意不同Qdrant版本可能在实现细节上有差异

通过正确理解这些机制，开发者可以更有效地利用Qdrant的混合搜索功能构建高效的向量检索系统。

Qdrant - High-performance, massive-scale Vector Database and Vector Search Engine for the next generation of AI. Also available in the cloud https://cloud.qdrant.io/

项目地址：https://gitcode.com/GitHub_Trending/qd/qdrant

登录后查看全文

项目优选

收起

deepin linux kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

昇腾LLM分布式训练框架

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

Oohos_react_native

React Native鸿蒙化仓库