Node SQL Parser 5.3.8版本发布:增强TSQL与BigQuery支持
Node SQL Parser是一个强大的JavaScript SQL解析器,能够将SQL语句解析为抽象语法树(AST),并支持多种数据库方言。该项目为开发者提供了分析、修改和生成SQL语句的能力,在数据库迁移、SQL格式化、查询优化等场景中非常有用。
主要功能增强
TSQL方言支持提升
5.3.8版本对TSQL(Transact-SQL)方言的支持有了显著提升。首先增加了对OFFSET FETCH NEXT分页模式的支持,这是TSQL中常用的分页语法。例如SELECT * FROM table ORDER BY id OFFSET 10 ROWS FETCH NEXT 5 ROWS ONLY这样的语句现在可以被正确解析。
其次,新版本改进了表值函数的解析能力。TSQL中的表值函数是一种特殊函数,可以返回表结构的结果集,现在这类函数的调用语法得到了完善支持。
BigQuery方言改进
针对Google BigQuery方言,5.3.8版本增加了对表函数的支持。表函数是BigQuery中的一种特殊函数,能够将输入转换为表结构输出,常用于数据转换和复杂查询场景。
PostgreSQL功能扩展
PostgreSQL方言方面,新增了对make_interval函数的支持,这是一个用于创建时间间隔的实用函数。同时扩展了几何数据类型的识别范围,使更多PostgreSQL特有的几何类型能够被正确解析。
重要问题修复
-
MySQL约束删除:修复了MySQL中DROP CONSTRAINT语句的解析问题,现在可以正确处理约束删除操作。
-
TSQL数据类型:修正了TSQL中VARCHAR和VARBINARY类型的MAX长度标识符的解析,确保这类特殊数据类型声明能被准确识别。
-
窗口函数范围:解决了所有数据库方言中窗口函数ROWS BETWEEN FOLLOWING AND FOLLOWING语法的问题,使这类高级窗口函数定义能够被正确解析。
-
标识符引用:改进了TSQL中AS关键字后带引号的标识符处理,确保这类特殊命名方式不会导致解析错误。
-
白名单匹配:优化了白名单检查机制,现在要求完全匹配而非部分匹配,提高了安全性。
技术细节优化
-
列引用增强:在列引用(column_ref)节点中添加了COLLATE类型信息,确保排序规则声明能够被保留在AST中。
-
赋值语句处理:改进了MySQL中带别名的赋值语句解析,使这类特殊语法结构能够被正确处理。
-
依赖项升级:更新了多个开发依赖项的版本,包括@babel/core、@babel/preset-env和elliptic等,提升了开发环境的安全性和稳定性。
总结
Node SQL Parser 5.3.8版本通过增强TSQL和BigQuery支持,修复多个关键问题,以及对PostgreSQL功能的扩展,进一步提升了其作为多方言SQL解析器的能力。这些改进使得开发者能够更准确地解析和处理各种复杂的SQL语句,特别是在企业级应用和跨数据库迁移场景中。对于需要处理多种SQL方言的项目,升级到5.3.8版本将获得更好的兼容性和稳定性。
AutoGLM-Phone-9BAutoGLM-Phone-9B是基于AutoGLM构建的移动智能助手框架,依托多模态感知理解手机屏幕并执行自动化操作。Jinja00
Kimi-K2-ThinkingKimi K2 Thinking 是最新、性能最强的开源思维模型。从 Kimi K2 开始,我们将其打造为能够逐步推理并动态调用工具的思维智能体。通过显著提升多步推理深度,并在 200–300 次连续调用中保持稳定的工具使用能力,它在 Humanity's Last Exam (HLE)、BrowseComp 等基准测试中树立了新的技术标杆。同时,K2 Thinking 是原生 INT4 量化模型,具备 256k 上下文窗口,实现了推理延迟和 GPU 内存占用的无损降低。Python00
GLM-4.6V-FP8GLM-4.6V-FP8是GLM-V系列开源模型,支持128K上下文窗口,融合原生多模态函数调用能力,实现从视觉感知到执行的闭环。具备文档理解、图文生成、前端重构等功能,适用于云集群与本地部署,在同类参数规模中视觉理解性能领先。Jinja00
HunyuanOCRHunyuanOCR 是基于混元原生多模态架构打造的领先端到端 OCR 专家级视觉语言模型。它采用仅 10 亿参数的轻量化设计,在业界多项基准测试中取得了当前最佳性能。该模型不仅精通复杂多语言文档解析,还在文本检测与识别、开放域信息抽取、视频字幕提取及图片翻译等实际应用场景中表现卓越。00
GLM-ASR-Nano-2512GLM-ASR-Nano-2512 是一款稳健的开源语音识别模型,参数规模为 15 亿。该模型专为应对真实场景的复杂性而设计,在保持紧凑体量的同时,多项基准测试表现优于 OpenAI Whisper V3。Python00
GLM-TTSGLM-TTS 是一款基于大语言模型的高质量文本转语音(TTS)合成系统,支持零样本语音克隆和流式推理。该系统采用两阶段架构,结合了用于语音 token 生成的大语言模型(LLM)和用于波形合成的流匹配(Flow Matching)模型。 通过引入多奖励强化学习框架,GLM-TTS 显著提升了合成语音的表现力,相比传统 TTS 系统实现了更自然的情感控制。Python00
Spark-Formalizer-X1-7BSpark-Formalizer 是由科大讯飞团队开发的专用大型语言模型,专注于数学自动形式化任务。该模型擅长将自然语言数学问题转化为精确的 Lean4 形式化语句,在形式化语句生成方面达到了业界领先水平。Python00