PMD项目中的PL/SQL解析器对TRIM函数处理问题分析

2025-06-09 06:34:04作者：江焘钦

问题背景

在PMD 7.9.0版本的PL/SQL解析器中，发现了一个关于TRIM函数解析的语法处理问题。当TRIM函数的参数中包含运算符表达式时，解析器会抛出ParseException异常。这个问题不仅影响函数定义中的TRIM调用，也影响SELECT语句中的TRIM使用。

问题表现

在以下两种场景中，PMD解析器都会报错：

函数定义中的TRIM调用：

function distinguishXML() return text is
begin
  return trim(x + y);
end;

SELECT语句中的TRIM调用：

select trim(x + y) from foo;

解析器会抛出"Encountered '+'"的错误，表明它无法处理TRIM函数参数中的运算符表达式。

技术分析

经过深入分析，发现这个问题源于Oracle数据库中TRIM函数的两种不同用法：

字符串TRIM函数：这是标准的SQL函数，用于去除字符串首尾的指定字符。其语法支持多种形式：
- TRIM(leading|trailing|both trim_char FROM source_string)
- TRIM(source_string)
集合TRIM方法：这是PL/SQL集合对象的方法，用于从集合末尾移除元素。其语法为：
- collection_name.TRIM(n)

PMD解析器最初将所有的TRIM调用都解释为字符串TRIM函数，而实际上Oracle数据库允许在TRIM函数的参数位置使用任意表达式，包括带有运算符的表达式。

解决方案

PMD团队通过修改语法解析规则来解决这个问题。主要调整包括：

允许TRIM函数的参数位置接受任意表达式，而不仅仅是简单的字面量或变量名。
增强对集合TRIM方法的支持，确保它能正确处理各种参数形式。
考虑到Oracle 23c开始支持不带FROM子句的SELECT语句，相关语法规则也进行了相应调整。

实际影响

这个修复使得PMD能够正确解析以下所有合法的TRIM使用场景：

-- 字符串TRIM函数
SELECT 'X' || TRIM(LEADING 1 FROM '  test  ') || 'X';
SELECT 'X' || TRIM(LEADING ' ' FROM '  test  ') || 'X';
SELECT 'X' || TRIM(BOTH ' ' FROM '  test  ') || 'X';
SELECT 'X' || TRIM(LEADING FROM '  test  ') || 'X';
SELECT TRIM(1+2);

-- 集合TRIM方法
collection_name.TRIM(x + y);