DOMPurify 项目中关于数据URI潜在XSS漏洞的分析与防护建议

2025-05-15 15:26:04作者：仰钰奇

DOMPurify - a DOM-only, super-fast, uber-tolerant XSS sanitizer for HTML, MathML and SVG. DOMPurify works with a secure default, but offers a lot of configurability and hooks. Demo:

项目地址：https://gitcode.com/gh_mirrors/do/DOMPurify

数据URI的安全风险概述

在HTML净化库DOMPurify中，存在一个值得关注的安全问题 - 某些HTML标签允许使用数据URI(data URI)作为属性值。这种特性虽然在某些场景下很有用，但也可能被不当利用，成为安全攻击或网络欺诈的载体。

技术原理分析

数据URI允许开发者将小型文件直接嵌入到文档中，格式通常为：

data:[<mediatype>][;base64],<data>

在DOMPurify的默认配置中，以下HTML标签允许使用数据URI：

<img>标签的src属性
<video>标签的src属性
<audio>标签的src属性
<source>标签的src属性

攻击者可以构造特殊的数据URI，在其中嵌入不当脚本或重定向代码。例如：

<img src="data:text/html;base64,PHNjcmlwdD53aW5kb3cubG9jYXRpb24ucmVwbGFjZSgiaHR0cHM6Ly93d3cuZ29vZ2xlLmNvbSIpOzwvc2NyaXB0Pg==">

当用户在新标签页中打开这类元素时，嵌入的JavaScript代码会被执行，可能导致：

自动重定向到欺诈网站
执行不当脚本
获取用户隐私信息

实际影响评估

这种攻击方式特别在电子邮件场景中具有较高风险。主流邮件服务如Gmail已经将包含此类数据URI的邮件标记为可疑内容，自动放入垃圾邮件文件夹并显示警告。

虽然DOMPurify开发团队认为这超出了其威胁模型的范畴(主要关注XSS防护而非钓鱼防护)，但对于需要处理用户生成内容的应用，特别是邮件系统，这仍然是一个需要重视的安全问题。

解决方案与防护建议

对于需要严格安全控制的场景，建议采取以下防护措施：

使用钩子函数过滤数据URI 可以通过DOMPurify提供的afterSanitizeAttributes钩子，实现对数据URI的过滤：

DOMPurify.addHook('afterSanitizeAttributes', function(node) {
    // 检查所有可能包含URI的属性
    const uriAttributes = ['src', 'href', 'xlink:href', 'action'];
    
    uriAttributes.forEach(attr => {
        if (node.hasAttribute(attr)) {
            const value = node.getAttribute(attr);
            if (value.startsWith('data:')) {
                node.removeAttribute(attr);
            }
        }
    });
});

扩展属性检查范围 除了常见的src属性外，还应检查以下属性：

href
xlink:href
action
其他可能接受URI的自定义属性

建立URI方案白名单 更精细的控制可以通过建立允许的URI方案白名单实现：

const ALLOWED_SCHEMES = ['http', 'https', 'ftp'];

DOMPurify.addHook('afterSanitizeAttributes', function(node) {
    const uriAttributes = ['src', 'href', 'xlink:href', 'action'];
    
    uriAttributes.forEach(attr => {
        if (node.hasAttribute(attr)) {
            const value = node.getAttribute(attr);
            const scheme = value.split(':')[0].toLowerCase();
            
            if (!ALLOWED_SCHEMES.includes(scheme)) {
                node.removeAttribute(attr);
            }
        }
    });
});