SQLGlot解析器中的表值函数与存储表识别问题

2025-05-30 06:52:58作者：毕习沙Eudora

在SQL查询解析过程中，准确识别依赖的表结构是一个常见需求。SQLGlot作为一款强大的SQL解析器，在处理PostgreSQL等数据库的视图定义时，其表依赖发现机制会同时返回存储表和表值函数，这给依赖分析带来了一定挑战。

问题现象

当使用SQLGlot解析包含表值函数的查询时，find_all(exp.Table)方法会将如jsonb_array_elements()这样的表值函数与实际的存储表(如users、organizations)一同返回。例如解析以下查询：

SELECT u.user_id AS id,
jsonb_build_object(
    'id', u.org_id,
    'name', org.display_name,
    'type', (
        SELECT array_agg(t.value ORDER BY t.value DESC)[1]
        FROM jsonb_array_elements(org.types) t(value)
    ),
    'source', u.source
) AS data
FROM users u
JOIN organizations org ON org.id = u.org_id;

解析结果会包含三个"表"：users、organizations和jsonb_array_elements。

技术背景

SQLGlot将表值函数也识别为Table节点的设计有其合理性：

表值函数在SQL语法中确实表现为表的形式，可以出现在FROM子句中
表值函数可能带有完整的限定路径，如catalog.schema.function_name()
表值函数可以像表一样被赋予别名和列定义

这种设计确保了语法树能够完整表示查询的语义结构。

解决方案

对于只需要识别物理存储表的情况，可以采用以下方法过滤结果：

方法一：检查表名存在性

storage_tables = [t for t in tables if t.name]

表值函数通常没有实际的表名(即name属性为None或空字符串)，而存储表则具有明确的表名。

方法二：类型检查过滤

from sqlglot import exp

storage_tables = [
    t for t in tables 
    if not isinstance(t, exp.Func)
]

这种方法直接排除函数类型的节点。

实际应用建议

在实际的数据库工具开发中，区分表值函数和存储表的需求很常见：

依赖分析：构建视图依赖图时通常只需要物理表
权限检查：表值函数和存储表的权限模型不同
SQL重写：表值函数可能需要特殊处理

建议在工具设计时明确区分这两种"表"的概念，根据具体场景选择合适的过滤策略。

总结

SQLGlot的这种设计提供了完整的语法表示能力，开发者需要根据实际需求进行适当的过滤处理。理解这一特性有助于更好地利用SQLGlot构建数据库相关工具，特别是在处理PostgreSQL等支持丰富表值函数的数据库时。

sqlglot

Python SQL Parser and Transpiler

项目地址：https://gitcode.com/gh_mirrors/sq/sqlglot

登录后查看全文

项目优选

收起

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

433

392

MindSpeed-MM

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.67 K

984

SQLGlot解析器中的表值函数与存储表识别问题

问题现象

技术背景

解决方案

方法一：检查表名存在性

方法二：类型检查过滤

实际应用建议

总结

相关内容推荐

热门内容推荐

项目优选