Typesense嵌套左连接查询中的过滤问题解析

2025-05-09 18:21:32作者：翟萌耘Ralph

Open Source alternative to Algolia + Pinecone and an Easier-to-Use alternative to ElasticSearch ⚡ 🔍 ✨ Fast, typo tolerant, in-memory fuzzy Search Engine for building delightful search experiences

项目地址：https://gitcode.com/gh_mirrors/ty/typesense

概述

在使用Typesense进行复杂数据查询时，嵌套左连接(left join)结合过滤条件时可能会出现不符合预期的结果。本文将深入分析这一问题，并通过实际案例展示如何正确使用Typesense的嵌套查询功能。

问题背景

Typesense作为一款开源搜索引擎，提供了强大的嵌套查询功能。当我们在查询中使用左连接并添加过滤条件时，期望只有符合过滤条件的引用文档被包含在结果中。然而，在某些嵌套查询场景下，即使引用文档不满足过滤条件，它们仍然会被包含在结果集中。

数据结构分析

我们有以下三个集合的数据结构：

集合a：包含商品信息，有id、vendor(供应商)和title(标题)字段
集合b：包含分类信息，有id、name(名称)和a_ids(引用集合a的id数组)字段
集合c：包含订单信息，有id、title(标题)和b_ids(引用集合b的id数组)字段

查询示例分析

用户尝试执行以下查询：

{
  "q": "*",
  "collection": "c",
  "query_by": "title",
  "filter_by": "$b(id:* || $a(vendor:[c]))",
  "include_fields": "$b(*, $a(*, strategy: nest_array), strategy: nest_array,)",
  "exclude_fields": "b_ids, id, $b(a_ids, id, $a(id))"
}

期望结果是只包含vendor为"c"的a文档，但实际结果却包含了所有a文档，无论它们是否满足vendor:[c]的过滤条件。

问题根源

Typesense的左连接实现方式导致了这一行为。在嵌套查询中，左连接会保留主文档的所有记录，即使关联的子文档不满足过滤条件。这与传统SQL中的左连接行为有所不同。

解决方案

要实现真正的过滤效果，应该使用更精确的查询方式：

{
  "q": "*",
  "collection": "c",
  "query_by": "title",
  "filter_by": "$b($a(vendor:[c]))",
  "include_fields": "$b(*, $a(*, strategy: nest_array), strategy: nest_array,)",
  "exclude_fields": "b_ids, id, $b(a_ids, id, $a(id))"
}