CrateDB中生成列的值校验机制解析

2025-06-14 18:21:03作者：平淮齐Percy

生成列的基本概念

在CrateDB中，生成列(GENERATED COLUMN)是一种特殊类型的列，其值由表中其他列的值通过表达式计算得出。这种设计模式在数据库领域被广泛用于自动计算和存储衍生数据，避免应用层重复计算的开销。

在CrateDB 5.10版本中，用户发现生成列的值校验行为存在不一致性。具体表现为：

这种不一致性可能导致数据完整性问题，也违背了生成列设计的初衷。

对于确定性表达式，CrateDB会在插入或更新数据时执行严格校验。例如：

CREATE TABLE test (a integer, g GENERATED ALWAYS AS a+1);
INSERT INTO test (a,g) VALUES (1,5);

系统会计算a+1得到2，然后与提供的值5比较，发现不匹配后抛出异常。

问题出在非确定性函数(如时间函数)的处理上：

CREATE TABLE test2 (a integer, g GENERATED ALWAYS AS CURRENT_TIMESTAMP);
INSERT INTO test2 (a,g) VALUES (1,'2025-01-01');

这种情况下，系统没有执行任何校验，直接接受了用户提供的值。

数据库函数通常分为三类：

当前CrateDB只区分了确定性和非确定性函数，没有完整实现稳定性分类体系，这是导致问题的根本原因。

开发团队经过讨论后决定：

这种设计权衡了数据一致性和实现复杂度，虽然可能限制了一些灵活性，但保证了数据可靠性。

CrateDB对生成列的处理体现了数据库设计中一致性与灵活性的平衡。理解这种机制有助于开发者设计更健壮的数据模型，避免潜在的数据完整性问题。随着版本演进，这一机制可能会进一步完善，开发者应持续关注相关更新。

登录后查看全文