KuzuDB中JSON属性比较的Bug解析与解决方案

2025-07-02 15:16:24作者：平淮齐Percy

问题背景

在使用KuzuDB 0.9.0版本时，开发者在处理JSON类型数据时遇到了一个类型转换问题。具体表现为：当尝试将JSON对象中的字符串属性与普通字符串进行比较时，系统会抛出"Data type of expression json_extract(s.properties,genre) should not be modified"的错误。

问题重现

假设我们有一个Song节点类型，其结构如下：

id: INT64
data_source: STRING
original_id: STRING
label: STRING
properties: STRING (实际存储JSON格式数据)

其中properties字段包含以下JSON结构：

{
  "name": "string",
  "year": 2023,
  "genre": "pop"
}

当执行如下查询时会出现问题：

MATCH (s:Song) WHERE json_extract(s.properties,'genre') = 'pop' RETURN s.*;

问题原因分析

经过KuzuDB开发团队的调查，发现问题的根源在于json_extract函数的返回值处理方式。该函数返回的是一个JSON格式的字符串值，这意味着即使提取的是原始字符串类型的数据，返回结果也会被额外的双引号包裹。

例如，对于genre字段值为"pop"的情况：

预期返回：pop
实际返回："pop"（包含双引号）

这种隐式的类型转换导致了比较操作失败，因为系统无法直接将JSON字符串格式的值与普通字符串进行比较。

解决方案

针对这个问题，开发团队提供了两种解决方案：

临时解决方案：在比较时手动添加双引号

MATCH (s:Song) WHERE json_extract(s.properties,'genre') = '"pop"' RETURN s.*;

永久解决方案：等待KuzuDB 0.9.1.dev10或更高版本发布，该版本已经修复了这个问题。

技术建议

对于使用JSON数据的开发者，建议注意以下几点：

在比较JSON提取的字符串值时，需要考虑JSON的序列化格式
对于数值类型的比较，由于JSON数值不需要额外引号，所以不会出现此问题
可以考虑使用KuzuDB提供的其他JSON处理函数来避免此类问题

版本更新

该问题已在KuzuDB的后续版本中得到修复。开发者可以通过以下方式获取修复后的版本：

从源代码构建
使用预发布的开发版本（0.9.1.dev10或更高）
等待下一个稳定版本发布

总结

JSON数据处理在数据库操作中是一个常见但容易出错的场景。KuzuDB团队快速响应并修复了这个类型转换问题，体现了开源项目的敏捷性。开发者在使用时应当注意数据类型的隐式转换，特别是在处理JSON这种复杂数据结构时。

登录后查看全文

项目优选

收起

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

456

438

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。