ANTLR4 PL/SQL语法解析器对表压缩子句的解析优化

2025-05-22 12:31:54作者：侯霆垣

在Oracle数据库的PL/SQL语法中，CREATE TABLE语句支持多种表压缩选项，包括行存储(row store)和列存储(column store)两种压缩方式。这些压缩选项对于数据库性能和存储效率至关重要。

问题背景

在ANTLR4的PL/SQL语法解析器项目中，开发者发现现有的语法规则无法正确解析包含特定压缩子句的CREATE TABLE语句。例如以下SQL语句：

CREATE TABLE "SCHEMA"."STUFF1"
(
  "STUFF_ID" NUMBER(15,0)
)
COLUMN STORE COMPRESS FOR QUERY LOW NO ROW LEVEL LOCKING;

原语法解析器会将压缩子句错误地解析为列属性(column_properties)，而不是表压缩选项(table_compression)，这导致解析器无法正确处理后续的SQL语句。

技术分析

根据Oracle官方文档，CREATE TABLE语句支持的表压缩语法包括：

基本压缩语法：COMPRESS [BASIC | FOR OLTP | FOR (QUERY|ARCHIVE) [LOW|HIGH]]
行存储压缩语法：ROW STORE COMPRESS [BASIC|ADVANCED]
列存储压缩语法：COLUMN STORE COMPRESS [FOR (QUERY|ARCHIVE) [LOW|HIGH]] [NO ROW LEVEL LOCKING]
无压缩选项：NOCOMPRESS

原ANTLR4语法规则仅支持基本压缩语法，缺少对行存储和列存储压缩语法的支持。这导致解析器无法正确识别完整的压缩选项。

解决方案

通过扩展table_compression规则，增加了对行存储和列存储压缩语法的支持：

table_compression
    : COMPRESS (BASIC | FOR ( OLTP | (QUERY | ARCHIVE) (LOW | HIGH)?))?
    | ROW STORE COMPRESS (BASIC | ADVANCED)?
    | COLUMN STORE COMPRESS (FOR (QUERY | ARCHIVE) (LOW | HIGH)? )? (NO? ROW LEVEL LOCKING)?
    | NOCOMPRESS
    ;

这一修改使得语法解析器能够：

正确识别行存储压缩选项
正确识别列存储压缩选项及其附加参数
保持对原有基本压缩语法的兼容性

实际效果

修改后的语法解析器能够正确解析包含复杂压缩选项的CREATE TABLE语句，生成正确的语法树结构。例如，对于包含列存储压缩选项的语句，解析器会将其识别为physical_properties下的segment_attributes_clause节点，而不是错误的column_properties节点。