Infinity项目中向量搜索相似度评分的获取方法解析

2025-06-20 01:08:40作者：范靓好Udolf

The AI-native database built for LLM applications, providing incredibly fast hybrid search of dense vector, sparse vector, tensor (multi-vector), and full-text.

项目地址：https://gitcode.com/gh_mirrors/inf/infinity

在Infinity数据库项目中进行向量相似度搜索时，开发者经常需要获取搜索结果的相关性评分。本文将详细介绍如何正确获取不同相似度度量方式下的评分结果。

相似度评分字段的区别

Infinity项目针对不同类型的相似度计算提供了三种不同的评分字段：

_score：专用于全文搜索中的BM25评分算法
_similarity：用于稠密或稀疏向量搜索中的IP（内积）和cosine（余弦）相似度计算
_distance：用于稠密向量搜索中的L2（欧几里得距离）度量

实际应用示例

余弦相似度场景

当使用余弦相似度进行向量搜索时，应该使用_similarity字段来获取评分结果：

res = table_text.output(["uuid", "file_path", "chunk_content", "_similarity"]
                      ).match_dense(
                      "chunk_embed", query_embed, "float", "cosine", k,
                      {"threshold": "0.5"}
                      ).to_df()

L2距离场景

对于使用欧几里得距离(L2)的搜索，则应使用_distance字段：

res = table_obj.output(["c1", "_distance"]).match_dense(
      "c2", [0.1, 0.1, 0.1, 0.1], "float", "l2", 1
      ).to_df()

注意事项

确保使用的评分字段与搜索时指定的相似度度量方式匹配
不同度量方式返回的评分范围不同：
- 余弦相似度：-1到1之间
- L2距离：0到正无穷（越小表示越相似）
可以通过设置threshold参数来过滤低质量结果

最佳实践建议

对于文本语义搜索，推荐使用余弦相似度配合_similarity字段
对于图像或推荐系统场景，根据需求选择L2距离或余弦相似度
在结果展示时，建议对原始评分进行归一化处理，提高可读性

通过正确使用这些评分字段，开发者可以更精确地控制搜索结果的质量，并为用户提供更相关的信息。

infinity

The AI-native database built for LLM applications, providing incredibly fast hybrid search of dense vector, sparse vector, tensor (multi-vector), and full-text.

项目地址：https://gitcode.com/gh_mirrors/inf/infinity

登录后查看全文

项目优选

收起

Ascend Extension for PyTorch

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件，通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求，让密码技术应用更简单，同时探索后量子等先进算法创新实践，构建密码前沿技术底座！

1.1 K

611

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

C++

1.01 K

MindSpeed-MM

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Infinity项目中向量搜索相似度评分的获取方法解析

相似度评分字段的区别

实际应用示例

余弦相似度场景

L2距离场景

注意事项

最佳实践建议

热门内容推荐

最新内容推荐

项目优选

Infinity项目中向量搜索相似度评分的获取方法解析

相似度评分字段的区别

实际应用示例

余弦相似度场景

L2距离场景

注意事项

最佳实践建议

相关内容推荐

热门内容推荐

最新内容推荐

项目优选