SQLGlot解析PostgreSQL中LATERAL与WITH ORDINALITY组合查询的问题分析

2025-05-29 02:45:35作者：秋泉律Samson

在SQL解析器SQLGlot的最新版本26.12.1中，我们发现了一个关于PostgreSQL特有语法解析的兼容性问题。这个问题涉及到PostgreSQL中两个强大的功能特性组合使用时的解析失败：LATERAL连接和WITH ORDINALITY子句。

PostgreSQL的LATERAL关键字允许子查询引用前面FROM项中的列，这在处理JSON数组等复杂数据类型时特别有用。而WITH ORDINALITY则为集合返回函数添加一个序号列，方便跟踪元素的原始位置。这两种功能在PostgreSQL中可以合法组合使用，但在SQLGlot中却引发了解析错误。

让我们深入分析这个问题的技术细节。在PostgreSQL中，当我们使用jsonb_array_elements这类集合返回函数时，可以同时应用LATERAL和WITH ORDINALITY。例如，以下查询是完全合法的：

SELECT *
FROM test_data,
     LATERAL jsonb_array_elements(data) WITH ORDINALITY AS elem(value, ordinality);

这个查询会展开test_data表中data列的JSON数组，同时为每个元素添加一个序号。LATERAL确保我们可以引用前面test_data表的data列，WITH ORDINALITY则提供元素的顺序信息。

然而，SQLGlot的PostgreSQL方言解析器在处理这种组合语法时会出现ParseError。通过测试发现，单独使用LATERAL或WITH ORDINALITY都能正确解析，但两者结合就会失败。这表明解析器的语法规则在处理这种特定组合时存在缺陷。

从技术实现角度看，这可能是由于解析器的语法规则未能正确识别WITH ORDINALITY作为LATERAL修饰后的集合函数的有效后缀。在PostgreSQL的语法规范中，WITH ORDINALITY实际上是集合返回函数的一部分，而不是独立的子句，这种细微的语法差异可能导致解析器误判。

对于开发者来说，这个问题的影响在于：任何尝试使用SQLGlot解析包含这种组合语法的PostgreSQL查询都会失败，即使这些查询在PostgreSQL中完全有效。这限制了SQLGlot在需要处理复杂JSON数据场景中的应用，特别是在需要保持元素顺序信息的ETL流程中。

解决这个问题的方向应该是扩展SQLGlot的PostgreSQL方言解析器，使其能够正确识别LATERAL与WITH ORDINALITY的组合语法模式。这需要对解析器的语法规则进行适当调整，确保它能正确处理集合返回函数的各种修饰组合。

这个问题也提醒我们，在实现SQL方言解析器时，需要特别注意各种语法元素的组合可能性，特别是像PostgreSQL这样功能丰富的数据库系统，其语法组合往往比标准SQL更加灵活多样。

sqlglot

Python SQL Parser and Transpiler

项目地址：https://gitcode.com/gh_mirrors/sq/sqlglot

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

SQLGlot解析PostgreSQL中LATERAL与WITH ORDINALITY组合查询的问题分析

热门内容推荐

最新内容推荐

项目优选

SQLGlot解析PostgreSQL中LATERAL与WITH ORDINALITY组合查询的问题分析

相关内容推荐

热门内容推荐

最新内容推荐

项目优选