首页
/ Rspamd正则表达式多重匹配功能异常分析

Rspamd正则表达式多重匹配功能异常分析

2025-07-03 11:14:32作者:邓越浪Henry

问题背景

Rspamd是一款开源的垃圾邮件过滤系统,其3.9.0版本中的正则表达式多重匹配功能(regexp_multi)出现了一个关键性bug。该问题导致当使用regexp_multi配置multimap时,系统无法正确计算最终得分,虽然符号得分显示正确,但总分计算出现偏差。

问题表现

在3.9.0版本中,当配置如下multimap规则时:

bad_word {
    type = "content";
    filter = "text";
    description = "Bad Word filter";
    map = "regexp_multi;file:///etc/rspamd/local.d/bad_word.txt";
    score = 1.0;
    symbol = "BAD_WORD";
    regexp = true;
}

测试结果显示符号BAD_WORD得分为4.00,但总分计算不正确。例如:

  • 各符号得分总和应为22.26
  • 实际显示总分仅为19.26

而在3.8.4版本中,相同配置下总分计算是正确的。

技术分析

经过代码审查和测试验证,该问题源于一个特定提交(ae103665a2ce2321f109a21a7534db6629a6132b)引入的变更。该提交原本是为了优化其他功能,但意外影响了regexp_multi的得分计算逻辑。

关键问题点在于:

  1. 多重正则匹配结果的得分聚合逻辑发生了变化
  2. 符号得分虽然正确显示,但未正确汇总到最终得分中
  3. 该问题与之前报告过的另一个问题(4978号)可能有相似之处

影响范围

该问题影响:

  • Rspamd 3.9.0版本
  • 使用regexp_multi配置的multimap规则
  • 依赖精确得分计算的过滤场景

解决方案

目前建议的解决方案包括:

  1. 回退到3.8.4稳定版本
  2. 等待官方修复补丁发布
  3. 手动回退问题提交(ae10366)以临时解决问题

最佳实践建议

为避免类似问题:

  1. 在生产环境升级前充分测试新版本
  2. 对关键过滤规则设置监控告警
  3. 保持关注官方更新和修复公告

该问题的修复将确保Rspamd的正则表达式多重匹配功能恢复预期行为,保证垃圾邮件过滤得分的准确性。

登录后查看全文
热门项目推荐
相关项目推荐