Marten项目中的字符串不区分大小写比较与通配符问题解析

2025-06-26 09:02:16作者：姚月梅Lane

Marten是一个.NET平台上的高性能文档数据库库，它基于PostgreSQL构建，为开发者提供了便捷的文档存储和查询功能。在最近的项目开发中，发现了一个关于字符串不区分大小写比较时处理通配符的问题，这个问题可能会影响到查询结果的准确性。

问题背景

在Marten中，当使用StringComparison.OrdinalIgnoreCase进行字符串不区分大小写比较时，底层实现会转换为PostgreSQL的ILIKE操作符。然而，ILIKE操作符会解释字符串中的通配符（%和_），这可能导致意外的查询结果。

考虑以下两个测试用例：

百分号通配符问题：当查询字符串包含%字符时，即使我们期望进行精确匹配，ILIKE也会将其解释为通配符。例如，查询"%MyString"会匹配到"MyString"，因为%被解释为任意字符序列。
下划线通配符问题：类似地，下划线_在ILIKE中被解释为匹配任意单个字符。查询"MyStrin_"会匹配到"MyString"，因为最后一个字符被解释为通配符。

在PostgreSQL中，ILIKE操作符确实支持通配符匹配，这与我们通常期望的字符串相等比较行为不同。当开发者使用.Equals()方法并指定StringComparison.OrdinalIgnoreCase时，他们期望的是精确匹配（仅忽略大小写），而不是通配符匹配。

Marten当前的实现没有对这些通配符进行转义处理，这导致了与预期不符的查询结果。在SQL标准中，正确的做法应该是对这些特殊字符进行转义，或者使用不解释通配符的比较操作符。

针对这个问题，Marten开发团队已经提交了修复代码。解决方案主要包括：

这个问题主要影响以下场景：

为了避免类似问题，开发者可以：

这个问题展示了数据库抽象层中一个常见挑战：如何在保持高级别抽象的同时，正确处理底层数据库的特殊行为。Marten团队快速响应并修复了这个问题，体现了开源项目的活跃维护状态。作为开发者，理解这些底层细节有助于编写更健壮的数据访问代码。

登录后查看全文