Rspamd正则表达式多重匹配功能异常分析

2025-07-03 04:49:29作者：邓越浪Henry

问题背景

Rspamd是一款开源的垃圾邮件过滤系统，其3.9.0版本中的正则表达式多重匹配功能(regexp_multi)出现了一个关键性bug。该问题导致当使用regexp_multi配置multimap时，系统无法正确计算最终得分，虽然符号得分显示正确，但总分计算出现偏差。

问题表现

在3.9.0版本中，当配置如下multimap规则时：

bad_word {
    type = "content";
    filter = "text";
    description = "Bad Word filter";
    map = "regexp_multi;file:///etc/rspamd/local.d/bad_word.txt";
    score = 1.0;
    symbol = "BAD_WORD";
    regexp = true;
}

测试结果显示符号BAD_WORD得分为4.00，但总分计算不正确。例如：

各符号得分总和应为22.26
实际显示总分仅为19.26

而在3.8.4版本中，相同配置下总分计算是正确的。

技术分析

经过代码审查和测试验证，该问题源于一个特定提交(ae103665a2ce2321f109a21a7534db6629a6132b)引入的变更。该提交原本是为了优化其他功能，但意外影响了regexp_multi的得分计算逻辑。

关键问题点在于：

多重正则匹配结果的得分聚合逻辑发生了变化
符号得分虽然正确显示，但未正确汇总到最终得分中
该问题与之前报告过的另一个问题(4978号)可能有相似之处

影响范围

该问题影响：

Rspamd 3.9.0版本
使用regexp_multi配置的multimap规则
依赖精确得分计算的过滤场景

解决方案

目前建议的解决方案包括：

回退到3.8.4稳定版本
等待官方修复补丁发布
手动回退问题提交(ae10366)以临时解决问题

最佳实践建议

为避免类似问题：

在生产环境升级前充分测试新版本
对关键过滤规则设置监控告警
保持关注官方更新和修复公告

该问题的修复将确保Rspamd的正则表达式多重匹配功能恢复预期行为，保证垃圾邮件过滤得分的准确性。

rspamd

Rapid spam filtering system.

项目地址：https://gitcode.com/gh_mirrors/rs/rspamd

登录后查看全文

项目优选

收起

Ascend Extension for PyTorch

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件，通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求，让密码技术应用更简单，同时探索后量子等先进算法创新实践，构建密码前沿技术底座！

1.1 K

611

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

C++

1.01 K

MindSpeed-MM

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Rspamd正则表达式多重匹配功能异常分析

问题背景

问题表现

技术分析

影响范围

解决方案

最佳实践建议

最新内容推荐

项目优选