Kuzu数据库递归查询优化问题解析

2025-07-02 07:22:53作者：裘晴惠Vivianne

问题背景

在使用Kuzu数据库时，开发人员发现一个特定类型的递归查询存在性能问题。当查询语句使用WITH子句结合递归关系时，查询执行会变得异常缓慢甚至挂起，而直接内联变量值的相同查询却能立即执行。

具体表现为以下两种查询语句的性能差异：

WITH 'Kùzu' as myname MATCH (c1:V {name: myname})-[* 1..2]->(c2:V) RETURN c1.name;

MATCH (c1:V {name: 'Kùzu'})-[* 1..2]->(c2:V) RETURN c1.name;

尽管查询逻辑完全相同，且递归深度被限制为1-2跳以避免性能问题，第一种写法仍会导致数据库执行计划卡住。

通过分析两种查询的执行计划，我们可以发现关键差异：

使用WITH子句的执行计划：
- 首先创建一个临时表存储变量myname
- 然后执行哈希连接和递归扩展操作
- 查询优化器未能有效优化这种执行路径
直接内联变量的执行计划：
- 使用了更高效的半掩码(SEMI_MASKER)操作
- 执行路径更直接，减少了中间步骤
- 查询优化器能够更好地优化这种写法

这个问题源于Kuzu数据库查询优化器在处理WITH子句与递归关系组合时的缺陷。具体来说：

该问题已在Kuzu数据库的代码库中被修复。修复方案主要涉及：

对于使用Kuzu数据库的开发人员，建议：

数据库查询优化是一个复杂的领域，特别是涉及递归查询时。Kuzu数据库团队持续改进查询优化器，以处理各种查询模式。这个特定问题的修复展示了数据库系统如何不断演进以提供更好的性能和用户体验。开发人员应保持对数据库新版本的关注，并理解不同查询写法的性能特征。

登录后查看全文