SQLGlot中Select语句构建的正确方式
2025-05-30 00:30:32作者:瞿蔚英Wynne
在SQL解析和生成工具SQLGlot中,构建SELECT语句时存在两种看似相似但实际上差异显著的方式。本文将深入探讨这两种方式的区别,并解释为什么其中一种方式会失效。
问题现象
当开发者尝试构建SELECT语句时,可能会遇到以下两种写法:
# 方式1:使用from_参数
q1 = exp.Select(
expressions=[exp.Star()],
from_=exp.From(this=values_exp)
)
# 方式2:使用from_方法
q2 = exp.Select(
expressions=[exp.Star()],
).from_(exp.From(this=values_exp))
表面上看,这两种方式应该产生相同的结果,但实际上第一种方式生成的SQL缺少FROM子句,而第二种方式则能正确生成完整的SQL语句。
根本原因
这个问题的根源在于SQLGlot的AST(抽象语法树)节点结构设计。在SQLGlot的内部实现中:
- SELECT语句的AST节点实际使用的是
from属性,而不是from_ - 当使用构造函数的
from_参数时,这个参数不会被正确映射到AST节点的from属性 - 而
from_()方法内部会正确处理这个映射关系,将值赋给正确的AST节点属性
最佳实践
基于这个发现,我们得出以下最佳实践建议:
- 优先使用链式方法调用:如
.from_()、.select()等方法,这些方法内部会正确处理AST节点的构建 - 避免直接通过构造函数参数构建复杂AST:特别是对于SQL关键字与Python关键字冲突的情况(如
from) - 谨慎使用代码补全建议:某些AI辅助工具可能会给出不准确的构造方式
深入理解
SQLGlot的这种设计实际上反映了AST构建的两种模式:
- 声明式构建:通过构造函数一次性指定所有属性
- 命令式构建:通过方法链逐步构建AST
在大多数情况下,方法链的方式更为可靠,因为:
- 方法内部可以包含额外的验证和处理逻辑
- 可以更清晰地表达构建过程
- 避免了Python关键字与SQL关键字的冲突问题
总结
在SQLGlot中构建SELECT语句时,推荐使用.from_()方法而非构造函数的from_参数。这不仅解决了当前的问题,也是更符合SQLGlot设计理念的做法。理解AST构建的这两种模式差异,有助于开发者更有效地使用SQLGlot进行SQL解析和生成。
登录后查看全文
热门项目推荐
相关项目推荐
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust0216
cann-learning-hubCANN 学习中心仓,支持在线互动运行、边学边练,提供教程、示例与优化方案,一站式助力昇腾开发者快速上手。Jupyter Notebook0138
uni-appA cross-platform framework using Vue.jsJavaScript08
GLM-5.2智谱开源 GLM-5.2,这是针对长文本任务的最新旗舰模型。相较于前代产品 GLM-5.1,它在长文本任务处理能力上实现了显著飞跃,并且首次在稳定的 100 万 token 上下文中提供这一能力。Jinja00
SwanLab⚡️SwanLab - an open-source, modern-design AI training tracking and visualization tool. Supports Cloud / Self-hosted use. Integrated with PyTorch / Transformers / LLaMA Factory / veRL/ Swift / Ultralytics / MMEngine / Keras etc.Python00
tiny-universe《大模型白盒子构建指南》:一个全手搓的Tiny-UniverseJupyter Notebook03
项目优选
收起
deepin linux kernel
C
32
16
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
471
465
Ascend Extension for PyTorch
Python
758
968
昇腾LLM分布式训练框架
Python
186
231
本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。
C++
698
1.4 K
本项目是CANN提供的transformer类大模型算子库,实现网络在NPU上加速计算。
C++
878
2.03 K
暂无描述
Dockerfile
780
5.08 K
🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer(第 2 版)》、《程序员面试金典(第 6 版)》题解
Java
70
22
本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本,由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用,3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。
Dart
1.04 K
271
Claude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed.
Get Started
Rust
2.08 K
216