PHP源码中extract()函数EXTR_REFS参数的UAF漏洞分析

2025-05-02 03:23:57作者：幸俭卉

在PHP语言的核心实现中，extract()函数是一个用于将数组中的键值对导入当前符号表的实用工具。当开发者使用EXTR_REFS标志时，函数会将数组元素作为引用导入。然而，这个功能在特定场景下会触发一个危险的内存安全问题。

问题原理

该问题源于对象析构与引用计数管理之间的时序问题。当以下两个条件同时满足时就会触发：

被extract()操作的数组键名与全局变量名相同
该全局变量是一个对象，且其析构函数会主动unset这个全局变量

示例中的关键代码展示了典型的触发场景：

class GetFree {
  public function __destruct() {
    unset($GLOBALS['b']);
  }
}

$b = new GetFree;
$array = array("b" => "AB");
extract($array, EXTR_REFS);

底层机制分析

在PHP引擎执行过程中，这个问题涉及以下几个关键步骤：

extract()开始处理数组时，首先会获取目标符号表中已存在的变量
当EXTR_REFS标志启用时，函数会尝试建立引用关系
在建立引用过程中，如果原始变量是对象，会触发引用计数调整
如果此时对象的析构函数被调用并unset了全局变量，会导致后续的引用计数操作访问已释放的内存

从ASAN报告可以看出，崩溃发生在zend_gc_delref的引用计数递减操作时，此时对象存储空间已被释放。

影响范围

这个内存安全问题会影响：

所有使用EXTR_REFS参数的extract()调用
涉及在析构函数中操作全局变量的场景
PHP 8.3及更高版本

虽然需要特定条件才能触发，但在复杂的应用场景中，特别是使用魔术方法或依赖全局状态管理的代码中，风险会显著增加。

解决方案

PHP开发团队通过以下方式修复了该问题：

在extract()操作前增加引用计数保护
确保在建立引用关系期间对象保持有效状态
优化了变量导入过程中的引用计数管理时序

修复后的实现保证了即使遇到析构函数中的unset操作，也能安全地完成引用建立过程，避免了内存安全问题情况的发生。

开发者建议

对于需要使用类似功能的开发者，建议：

避免在对象析构函数中操作可能被extract()处理的全局变量
谨慎使用EXTR_REFS参数，特别是在不确定变量来源的情况下
考虑使用更明确的变量赋值方式替代extract()
对于必须使用extract()的场景，确保对输入数组进行严格过滤

这个案例再次提醒我们，在涉及引用管理和对象生命周期时要格外小心，特别是在PHP这种具有复杂变量符号表和引用计数机制的语言中。

php-src

The PHP Interpreter

项目地址：https://gitcode.com/GitHub_Trending/ph/php-src

登录后查看全文