DOMPurify中处理HTML注释节点的安全实践

2025-05-15 23:57:09作者：何举烈Damon

DOMPurify - a DOM-only, super-fast, uber-tolerant XSS sanitizer for HTML, MathML and SVG. DOMPurify works with a secure default, but offers a lot of configurability and hooks. Demo:

项目地址：https://gitcode.com/gh_mirrors/do/DOMPurify

问题背景

在使用DOMPurify进行HTML净化时，开发者可能会遇到需要特殊处理注释节点的情况。最新版本(3.1.7)中，当尝试在uponSanitizeElement钩子中移除或替换HTML注释节点时，浏览器会抛出"非法调用(Illegal invocation)"错误。

问题现象

开发者尝试通过以下方式处理注释节点：

DOMPurify.addHook('uponSanitizeElement', (node, data) => {
    if (data.tagName === '#comment') {
        node.parentNode.removeChild(node);
    }
});

这段代码会导致浏览器抛出异常，提示Element.prototype.remove被非法调用。有趣的是，同样的操作对普通元素(如<b>标签)却能正常工作。

技术分析

根本原因

节点类型判断错误：注释节点没有tagName属性，正确的判断方式应该是检查nodeName属性是否为#comment
安全机制变更：DOMPurify在6e03334提交中修改了节点移除方式，原先直接调用remove()方法的方式被认为不够安全
防御性编程不足：在调用parentNode.removeChild(node)前没有检查父节点是否存在

安全考量

DOMPurify维护者指出，简单的使用可选链操作符(?.)来修复这个问题可能会引入安全问题。特别是当处理恶意构造的HTML时，如：

hello<form><input name=nodeName><input name=parentNode><input name=remove>

这种结构可能会绕过安全检查，导致意外行为。

解决方案

推荐做法

正确识别注释节点：

if (data.nodeName === '#comment') {
    // 处理注释节点
}

替代方案：如果目标是保留注释内容但以安全方式呈现，可以：
- 创建包含注释内容的文本节点
- 让DOMPurify按默认流程移除原始注释节点

DOMPurify.addHook('uponSanitizeElement', (node, data) => {
    if (data.nodeName === '#comment') {
        const textNode = document.createTextNode('<!--' + node.data + '-->');
        node.replaceWith(textNode);
    }
});

理解默认行为：DOMPurify默认会过滤掉注释节点，除非有特殊需求，否则不需要额外处理

最佳实践建议

优先使用DOMPurify的默认净化机制，除非有明确需求才自定义处理
处理节点时始终考虑安全性，特别是涉及DOM操作时
充分测试自定义钩子，确保在各种边缘情况下行为符合预期
关注项目更新日志，及时了解安全相关的变更

通过理解这些原理和实践，开发者可以更安全有效地使用DOMPurify处理HTML内容，包括特殊的注释节点情况。

DOMPurify