Npgsql.EntityFrameworkCore.PostgreSQL 8.0版本中Regex.IsMatch参数转义问题解析

2025-07-10 16:21:07作者：房伟宁

在数据库操作中，SQL注入一直是开发者需要警惕的安全隐患。近期，Npgsql.EntityFrameworkCore.PostgreSQL（PostgreSQL的EF Core提供程序）在8.0.0-preview.1版本中引入了一个值得注意的行为变更——当使用Regex.IsMatch方法时，其参数不再自动进行SQL转义处理。本文将深入分析这一问题的影响、产生原因及解决方案。

问题现象

在常规的LINQ查询中，字符串常量会被自动转义。例如以下查询：

query.Where(entity => entity.Field == "';delete from injection_regex_table;select '")

会被正确转换为：

WHERE i.field = ''';delete from injection_regex_table;select '''

然而，当使用Regex.IsMatch方法时，情况发生了变化：

query.Where(entity => Regex.IsMatch(entity.Field,
    "';delete from injection_regex_table;select '",
    RegexOptions.IgnoreCase))

在8.0.0-preview.1版本中生成的SQL为：

WHERE i.field ~* '(?p)';delete from injection_regex_table;select ''

可以看到，正则表达式参数未被转义，直接拼接到了SQL语句中。

技术背景

这个问题源于Npgsql.EntityFrameworkCore.PostgreSQL内部对正则表达式处理的优化。在7.0.18版本中，正则表达式参数会被安全处理：

WHERE i.field ~ ('(?ip)' || ''';delete from injection_regex_table;select ''')

其中使用了字符串连接操作符(||)并正确转义了参数。

8.0.0-preview.1版本为了提高性能，改为直接将正则表达式模式内联到SQL中，但疏忽了安全转义这一关键步骤。

安全影响

虽然这种情况需要攻击者能够控制正则表达式模式字符串，但在以下场景中仍可能构成风险：

动态构建表达式树时错误使用Expression.Constant
从不可信来源获取正则表达式模式
在共享代码库中意外引入恶意模式

解决方案

Npgsql团队已经意识到这个问题，并在8.0.8版本中修复了此漏洞。对于暂时无法升级的用户，可以采用以下临时解决方案：

private class FakeFieldClass<TValue>
{
    public TValue Value = default!;
}

public static MemberExpression CreateArgument<TValue>(TValue value)
{
    var fakeField = new FakeFieldClass<TValue> { Value = value };
    return Expression.Field(Expression.Constant(fakeField), nameof(fakeField.Value));
}