SQLGlot中Select语句构建的正确方式
2025-05-30 00:30:32作者:瞿蔚英Wynne
在SQL解析和生成工具SQLGlot中,构建SELECT语句时存在两种看似相似但实际上差异显著的方式。本文将深入探讨这两种方式的区别,并解释为什么其中一种方式会失效。
问题现象
当开发者尝试构建SELECT语句时,可能会遇到以下两种写法:
# 方式1:使用from_参数
q1 = exp.Select(
expressions=[exp.Star()],
from_=exp.From(this=values_exp)
)
# 方式2:使用from_方法
q2 = exp.Select(
expressions=[exp.Star()],
).from_(exp.From(this=values_exp))
表面上看,这两种方式应该产生相同的结果,但实际上第一种方式生成的SQL缺少FROM子句,而第二种方式则能正确生成完整的SQL语句。
根本原因
这个问题的根源在于SQLGlot的AST(抽象语法树)节点结构设计。在SQLGlot的内部实现中:
- SELECT语句的AST节点实际使用的是
from属性,而不是from_ - 当使用构造函数的
from_参数时,这个参数不会被正确映射到AST节点的from属性 - 而
from_()方法内部会正确处理这个映射关系,将值赋给正确的AST节点属性
最佳实践
基于这个发现,我们得出以下最佳实践建议:
- 优先使用链式方法调用:如
.from_()、.select()等方法,这些方法内部会正确处理AST节点的构建 - 避免直接通过构造函数参数构建复杂AST:特别是对于SQL关键字与Python关键字冲突的情况(如
from) - 谨慎使用代码补全建议:某些AI辅助工具可能会给出不准确的构造方式
深入理解
SQLGlot的这种设计实际上反映了AST构建的两种模式:
- 声明式构建:通过构造函数一次性指定所有属性
- 命令式构建:通过方法链逐步构建AST
在大多数情况下,方法链的方式更为可靠,因为:
- 方法内部可以包含额外的验证和处理逻辑
- 可以更清晰地表达构建过程
- 避免了Python关键字与SQL关键字的冲突问题
总结
在SQLGlot中构建SELECT语句时,推荐使用.from_()方法而非构造函数的from_参数。这不仅解决了当前的问题,也是更符合SQLGlot设计理念的做法。理解AST构建的这两种模式差异,有助于开发者更有效地使用SQLGlot进行SQL解析和生成。
登录后查看全文
热门项目推荐
相关项目推荐
GLM-5智谱 AI 正式发布 GLM-5,旨在应对复杂系统工程和长时域智能体任务。Jinja00
GLM-5.1GLM-5.1是智谱迄今最智能的旗舰模型,也是目前全球最强的开源模型。GLM-5.1大大提高了代码能力,在完成长程任务方面提升尤为显著。和此前分钟级交互的模型不同,它能够在一次任务中独立、持续工作超过8小时,期间自主规划、执行、自我进化,最终交付完整的工程级成果。Jinja00
LongCat-AudioDiT-1BLongCat-AudioDiT 是一款基于扩散模型的文本转语音(TTS)模型,代表了当前该领域的最高水平(SOTA),它直接在波形潜空间中进行操作。00- QQwen3.5-397B-A17BQwen3.5 实现了重大飞跃,整合了多模态学习、架构效率、强化学习规模以及全球可访问性等方面的突破性进展,旨在为开发者和企业赋予前所未有的能力与效率。Jinja00
HY-Embodied-0.5这是一套专为现实世界具身智能打造的基础模型。该系列模型采用创新的混合Transformer(Mixture-of-Transformers, MoT) 架构,通过潜在令牌实现模态特异性计算,显著提升了细粒度感知能力。Jinja00
FreeSql功能强大的对象关系映射(O/RM)组件,支持 .NET Core 2.1+、.NET Framework 4.0+、Xamarin 以及 AOT。C#00
热门内容推荐
最新内容推荐
项目优选
收起
deepin linux kernel
C
27
14
OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
658
4.26 K
Ascend Extension for PyTorch
Python
503
607
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
939
862
Oohos_react_native
React Native鸿蒙化仓库
JavaScript
334
378
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
390
285
AscendNPU-IR是基于MLIR(Multi-Level Intermediate Representation)构建的,面向昇腾亲和算子编译时使用的中间表示,提供昇腾完备表达能力,通过编译优化提升昇腾AI处理器计算效率,支持通过生态框架使能昇腾AI处理器与深度调优
C++
123
195
openGauss kernel ~ openGauss is an open source relational database management system
C++
180
258
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
1.54 K
892
昇腾LLM分布式训练框架
Python
142
168