RDKit项目在PostgreSQL 17中的运算符冲突问题解析

2025-06-28 15:32:09作者：齐冠琰

问题背景

RDKit作为一款开源化学信息学工具包，其PostgreSQL扩展在升级到PostgreSQL 17版本时遇到了运算符定义冲突的问题。具体表现为在创建@=运算符时系统报错，提示"commutator operator = is already the commutator of operator ="。这一错误直接影响了RDKit在PostgreSQL 17环境下的正常使用。

技术原理分析

在PostgreSQL中，运算符可以定义"交换子"(commutator)属性，这是数据库优化器用来重写查询的一个重要特性。当定义A运算符的交换子为B时，优化器可以将"A x y"形式的表达式自动转换为"B y x"。

PostgreSQL 17引入了一项重要变更：加强了运算符交换子和否定子(negator)的校验逻辑。新版本不允许不同的运算符声明同一个交换子或否定子关系，这直接导致了RDKit扩展中的运算符定义冲突。

具体冲突点

RDKit扩展中定义了一个特殊的@=运算符，其SQL定义如下：

CREATE OPERATOR @= (
    LEFTARG = mol,
    RIGHTARG = mol,
    PROCEDURE = mol_eq,
    COMMUTATOR = '=',
    NEGATOR = '<>',
    RESTRICT = eqsel,
    JOIN = eqjoinsel
);

问题在于这个运算符试图将自己声明为标准等号运算符=的交换子，而PostgreSQL 17不允许这种重复定义。本质上，这是运算符设计上的一个规范性问题——不能有多个运算符同时声称自己是同一个运算符的交换子。

解决方案探讨

要解决这个问题，需要从运算符设计的规范性入手，具体可以考虑以下几种方案：

规范运算符定义：重新设计RDKit的运算符体系，明确哪些是"规范"运算符，哪些是辅助运算符。规范运算符可以保留完整的交换子和否定子定义，而辅助运算符则应避免定义这些属性。
运算符替代：评估@=运算符的实际用途，考虑是否可以用标准=运算符替代，或者修改其定义使其不再与标准运算符产生冲突。
版本适配：为PostgreSQL 17及以上版本提供专门的运算符定义，同时保留旧版本的兼容性定义。