KuzuDB JSON导入时关系表默认值未正确设置的Bug分析

2025-07-02 04:00:24作者：仰钰奇

问题概述

在使用KuzuDB v0.8.2版本时，发现通过JSON文件导入数据到关系表时，预先定义的默认值没有被正确设置。具体表现为：当关系表中某些字段定义了默认值（如布尔类型的DEFAULT true），但在JSON文件中没有显式包含这些字段时，这些字段会被设置为NULL而非预设的默认值。

技术背景

KuzuDB是一个高性能的图数据库系统，支持通过多种方式导入数据，包括CSV和JSON格式。在关系型数据库中，字段默认值是常见的功能，它允许开发者为字段指定当没有显式提供值时的默认行为。

问题复现

假设我们有以下关系表定义：

CREATE REL TABLE IF NOT EXISTS FOOBAR (
    FROM X TO Y,
    FROM Z TO Y,
    is_verified BOOLEAN DEFAULT true,
    is_confirmed BOOLEAN DEFAULT true
)

当使用以下命令导入JSON数据时：

COPY FOOBAR FROM 'xxx.json'

如果JSON文件中没有包含is_verified和is_confirmed字段，这些字段会被设置为NULL，而不是预设的默认值true。

问题原因分析

经过KuzuDB开发团队的分析，这个问题源于JSON导入机制的工作方式：

当使用标准COPY FROM命令导入JSON文件时，系统会预期JSON中包含所有字段（包括from、to以及关系属性）
如果JSON中缺少某个字段，JSON解析器会将该字段值设为NULL
系统不会检查该字段是否在表定义中有默认值设置

解决方案

KuzuDB提供了两种解决方案：

显式指定子字段导入：使用COPY FROM的子字段指定语法，明确告诉系统哪些字段需要从JSON读取，哪些使用默认值
```
COPY FOOBAR(is_verified) FROM 'xxx.json'
```
这样系统会明确知道is_confirmed应该使用默认值
确保JSON包含所有字段：在JSON数据中显式包含所有字段，包括那些有默认值的字段