SQL Formatter项目中的DuckDB关键字格式化问题解析

2025-06-30 04:16:29作者：江焘钦

在SQL代码格式化工具SQL Formatter的最新版本中，发现了一个针对DuckDB数据库的关键字格式化问题。这个问题涉及到SQL语法中两个基础但重要的关键字——IS和NULL的格式化处理。

问题背景

SQL Formatter是一个广泛使用的代码格式化工具，它能够自动将SQL语句按照预设的规则进行标准化排版。在DuckDB数据库方言的支持中，开发团队发现了一个格式化异常：当SQL查询中包含IS NOT NULL条件判断时，格式化结果不符合预期。

在原始SQL语句中，开发者编写了如下条件判断：

WHERE my_col is not null

按照SQL标准规范，关键字应该统一转为大写形式。然而，格式化后的输出却出现了不一致的情况：

WHERE my_col is NOT null

可以看到，只有NOT被正确转换为大写，而IS和NULL则保留了原始的小写形式。

经过项目维护团队的调查，发现这个问题主要由两个因素导致：

关键字定义缺失：在DuckDB的关键字定义列表中，IS关键字被遗漏了，导致格式化引擎无法识别并转换它。
NULL的双重身份：NULL在SQL中既是关键字又是特殊值，这种双重身份可能导致格式化引擎在处理时出现歧义。虽然NULL确实被定义为关键字，但由于它同时也可以作为函数参数或特殊值使用，格式化引擎可能没有统一处理它的转换规则。

项目维护团队迅速响应并修复了这个问题：

修复后的版本（15.6.4）和对应的VSCode扩展（4.2.1）已经发布，现在能够正确地将上述SQL语句格式化为：

WHERE my_col IS NOT NULL

这个案例提醒我们几个重要的开发实践：

对于使用SQL Formatter的开发者来说，及时更新到最新版本可以确保获得最准确的格式化结果，特别是在使用DuckDB这类新兴数据库时。

登录后查看全文