Fail2ban项目中的Apache日志过滤规则优化实践

2025-05-15 19:46:04作者：凌朦慧Richard

在Web服务器安全防护领域，Fail2ban作为一款经典的入侵防御工具，其日志过滤规则的精确性直接关系到防护效果。本文针对Apache服务器中常见的两种攻击模式，深入分析其日志特征及对应的Fail2ban过滤规则优化方案。

一、CGI脚本异常场景分析

Apache服务器在处理CGI请求时，当遇到脚本不存在或无法访问的情况，会产生如下典型日志条目：

[Wed Dec 18 23:58:03.148113 2024] [cgi:error] [pid 1672:tid 1878] [client 95.214.55.74:35092] AH02811: stderr from /usr/lib/cgi-bin/luci: script not found or unable to stat

这类日志通常表明攻击者正在尝试探测服务器上的CGI脚本问题。针对此场景，优化后的过滤规则需要具备以下特性：

精确匹配cgi:error日志模块
捕获AH02811错误代码
识别"script not found"关键错误描述

技术实现要点：

failregex = ^\s*(?:\[(?![a-z]+:error)[^\]]*\] )*\[cgi:error\] (?:\[(?!client)[^\]]*\] )*\[client <ADDR>:\d+\] AH02811: stderr from [^:]+: script not found or unable to stat

二、路径遍历攻击检测优化

攻击者常通过构造特殊URI路径尝试目录遍历操作，相关日志特征如下：

[Wed Dec 18 15:23:15.495667 2024] [core:error] [pid 1672:tid 1839] [client 47.251.103.74:39140] AH10244: invalid URI path (/cgi-bin/%%32%65%%32%65/%%32%65%%32%65/%%32%65%%32%65/%%32%65%%32%65/%%32%65%%32%65/%%32%65%%32%65/%%32%65%%32%65/bin/sh)

这类攻击的检测规则需要：

匹配core:error日志模块
识别AH10244错误代码
捕获"invalid URI path"关键字段

优化后的正则表达式：

failregex = ^\s*(?:\[(?![a-z]+:error)[^\]]*\] )*\[core:error\] (?:\[(?!client)[^\]]*\] )*\[client <ADDR>:\d+\] AH10244: invalid URI path

三、复合规则设计策略

对于需要同时检测多种攻击模式的场景，可以采用复合正则表达式方案。这种设计既能减少规则数量，又能提高匹配效率：

failregex = ^\s*(?:\[(?![a-z]+:error)[^\]]*\] )*\[(?:core|cgi):error\] (?:\[(?!client)[^\]]*\] )*\[client <ADDR>:\d+\] AH(?:10244|02811): (?:invalid URI path|stderr from [^:]+: script not found or unable to stat)