ModSecurity中变量与集合的工作原理详解

2025-05-26 02:28:46作者：范靓好Udolf

ModSecurity is an open source, cross platform web application firewall (WAF) engine for Apache, IIS and Nginx. It has a robust event-based programming language which provides protection from a range of attacks against web applications and allows for HTTP traffic monitoring, logging and real-time analysis.

项目地址：https://gitcode.com/gh_mirrors/mo/ModSecurity

变量生命周期与持久化存储

在ModSecurity 3.x版本中，变量的生命周期取决于所使用的存储后端。系统提供两种持久化存储机制：

内存存储：默认情况下，所有集合变量都保存在内存中。这些数据会一直存在，直到HTTP守护进程重启。服务器重启后，所有内存中的变量数据都会丢失。
LMDB存储：如果在编译时通过./configure --with-lmdb启用了LMDB支持，集合变量将被存储在LMDB数据库中。这种情况下，如果没有设置过期时间，变量会永久保存在数据库中，直到手动删除数据库文件。

变量过期机制

通过expirevar指令可以设置变量的过期时间。例如expirevar:ip.dangerous_activity=60表示该变量将在设置60秒后自动从存储中移除。这个过期时间是绝对的，从设置时刻开始计算，与客户端IP无关。

集合(Collection)工作机制

集合是ModSecurity中组织变量的重要机制，特别是对于需要跨事务保持状态的变量：

集合初始化：使用initcol指令初始化集合。例如initcol:ip=%{remote_addr}_%{tx.ua_hash}会创建一个基于客户端IP和User-Agent哈希组合的命名空间。
集合生命周期：
- 内存模式下：集合数据持续到服务器重启
- LMDB模式下：集合数据持久化存储在磁盘上
变量与集合关系：变量总是属于某个特定的集合。例如ip.dangerous_activity变量属于ip集合，而tx.foo变量则属于事务级的TX集合。

实际应用示例

一个典型的使用场景是限制客户端错误请求频率：

SecRule RESPONSE_STATUS "@rx ^(?:5|4(?!04))" \
  "phase:5,\
  pass,\
  setvar:ip.dangerous_activity=+1,\
  expirevar:ip.dangerous_activity=60,\
  nolog"

SecRule ip:dangerous_activity "@ge 5" \
  "phase:2,\
   deny,\
   status:406"

这个规则组合实现了：