CoreRuleSet项目中PHP过滤器绕过问题分析与改进方案

2025-06-30 11:06:28作者：裴麒琰

OWASP ModSecurity Core Rule Set (Official Repository)

项目地址：https://gitcode.com/gh_mirrors/co/coreruleset

问题背景

在Web应用安全防护领域，CoreRuleSet(CRS)作为ModSecurity的规则集，一直致力于提供全面的攻击防护。近期发现一个关于PHP注入攻击检测的潜在绕过问题，涉及PHP标签与XML声明的混淆使用。

技术细节

该问题的核心在于PHP解释器对标签语法的灵活处理。PHP允许使用<?xml :作为有效的PHP代码起始标记，其中的冒号(:)实际上是一个PHP标签(label)语法。这种特性使得攻击者可以构造特殊的"XML/PHP多语言"载荷，绕过现有的PHP注入检测规则。

具体表现为：

攻击载荷示例：<?xml :echo 1;或更复杂的<?xml :fputCSV($alreadyOpenFile, array("foo", "bar"));
这些载荷在PHP解释器中会被正常执行，但CRS的PHP注入检测规则(933100)未能有效识别

现有防护机制分析

当前CRS的933100规则使用以下正则表达式检测PHP注入：

(?:<\?(?:[^x]|x[^m]|xm[^l]|xml[^\s]|xml$|$)|<\?php|\[(?:/|\x5c)?php\])

该规则能够检测：

基本的PHP开放标签<?、<?php
不完整的XML声明如<?x、<?xm
无空格后续内容的XML声明如<?xml:

但存在以下不足：

无法检测<?xml :(带空格和冒号)这种有效PHP语法
对XML声明后跟PHP代码的情况检测不够全面

改进方案

基于XML规范(W3C TR/xml)和PHP语法特性的深入分析，提出以下改进方案：

XML声明规范分析：
- 合法XML声明格式为<?xml后跟版本、编码等属性
- 只允许特定属性名：version、encoding、standalone
- 属性间只允许特定空白字符(#x20、#x9、#xD、#xA)
改进的正则表达式：
```
(?:<\?(?:[^x]|x[^m]|xm[^l]|xml[^\s]|xml$|xml\s*[^a-zA-Z]|$)|<\?php|\[(?:/|\x5c)?php\])
```
- 新增xml\s*[^a-zA-Z]模式检测非法后续内容
- 保持对原有攻击模式的兼容检测
- 严格限制XML声明后只能跟字母(属性名)或规范允许的空白
实现策略：
- 将复杂正则表达式分解为可维护的数据文件
- 通过生成器构建最终规则表达式
- 确保不影响现有规则性能

实际影响评估

该改进方案能够有效检测以下攻击变种：

<?xml :后跟任意PHP代码
带多个空格的变种如<?xml :
其他非规范XML声明后跟可执行代码的情况

同时避免了误报合法XML声明的情况，如：

<?xml version="1.0"?>
<?xml encoding="UTF-8"?>

总结

此次改进展示了安全规则集开发中的典型挑战：需要在多种语言规范间找到精确的检测平衡点。通过深入分析PHP和XML的语法规范，CRS项目组实现了既保持高检测率又避免误报的改进方案，进一步巩固了其对PHP注入攻击的防护能力。

OWASP ModSecurity Core Rule Set (Official Repository)

项目地址：https://gitcode.com/gh_mirrors/co/coreruleset

登录后查看全文

热门内容推荐

1 【亲测免费】开源项目 `build-your-own-x` 使用指南 2 【亲测免费】探索科技之旅：《Build Your Own X》项目详解 3 GitHub_Trending/bu/build-your-own-x自动化：CI/CD流程在自制项目中的应用 4 从零打造智能家居系统：用build-your-own-x实现家庭自动化

最新内容推荐

Degrees of Lewdity中文汉化终极指南：零基础玩家必看的完整教程 Unity游戏翻译神器：XUnity Auto Translator 完整使用指南 PythonWin7终极指南：在Windows 7上轻松安装Python 3.9+终极macOS键盘定制指南：用Karabiner-Elements提升10倍效率 Pandas数据分析实战指南：从零基础到数据处理高手 Qwen3-235B-FP8震撼升级：256K上下文+22B激活参数 7步搞定机械键盘PCB设计：从零开始打造你的专属键盘终极WeMod专业版解锁指南：3步免费获取完整高级功能 DeepSeek-R1-Distill-Qwen-32B技术揭秘：小模型如何实现大模型性能突破音频修复终极指南：让每一段受损声音重获新生

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

openGauss-server

openGauss kernel ~ openGauss is an open source relational database management system

flutter_flutter

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统