Symfony HtmlSanitizer组件中的URL主机匹配问题分析与修复

2025-05-05 05:36:29作者：裴麒琰

在Symfony框架的HtmlSanitizer组件中，开发人员发现了一个关于URL主机名匹配的重要问题。这个问题出现在6.1.0及以上版本中，当配置了多个允许的主机名时，URL净化功能会出现未定义数组键访问的错误。

问题背景

HtmlSanitizer组件是Symfony框架中用于净化HTML内容的重要工具，它可以防止跨站脚本攻击等安全问题。其中的URL净化功能(UrlSanitizer)负责确保所有链接都指向可信的主机。当配置了多个允许的主机名时，系统需要验证输入的URL是否匹配任一允许的主机。

问题重现与分析

问题的核心出现在UrlSanitizer类的matchAllowedHostParts方法中。该方法负责比较URL的主机部分与配置的允许主机列表。当允许的主机名比实际URL的主机名包含更多部分时（例如允许"subdomain.trusted.com"但URL是"trusted.com"），代码会尝试访问不存在的数组索引，导致未定义键错误。

具体来说，当处理以下情况时会出现问题：

允许的主机：["subdomain.trusted.com", "trusted.com"]
输入URL："https://trusted.com/link.php"

系统会将主机名分割为部分进行比较，但由于"subdomain.trusted.com"有三个部分而"trusted.com"只有两个，比较时会访问不存在的第三个索引。

解决方案

经过分析，提出了一个简单而有效的修复方案：在比较主机部分前，先检查数组键是否存在。修改后的matchAllowedHostParts方法如下：

private static function matchAllowedHostParts(array $uriParts, array $trustedParts): bool
{
    foreach ($trustedParts as $key => $trustedPart) {
        if (array_key_exists($key, $uriParts) && $uriParts[$key] !== $trustedPart) {
            return false;
        }
    }
    return true;
}