DOMPurify项目中样式标签内注释引发的安全过滤问题解析

2025-05-15 11:01:03作者：平淮齐Percy

DOMPurify - a DOM-only, super-fast, uber-tolerant XSS sanitizer for HTML, MathML and SVG. DOMPurify works with a secure default, but offers a lot of configurability and hooks. Demo:

项目地址：https://gitcode.com/gh_mirrors/do/DOMPurify

问题背景

在使用DOMPurify这个流行的HTML净化库时，开发人员可能会遇到一个特殊场景：当样式标签(<style>)内包含特定格式的代码注释时，整个样式节点会被意外移除。这种情况通常发生在处理第三方库生成的HTML内容时，特别是当样式注释中包含类似HTML标签结构的文本（如作者邮箱被尖括号包裹）时。

问题现象

具体表现为：当样式注释中包含类似<author_email@example.com>这样的文本结构时，DOMPurify的安全机制会将整个<style>节点视为潜在威胁而完全移除。这会导致页面样式丢失，影响UI呈现。

技术原理

这个问题的根源在于DOMPurify对mXSS(突变XSS)攻击的防护机制。mXSS是一种特殊的跨站脚本攻击方式，攻击者利用浏览器对HTML解析的特殊处理来绕过常规的XSS防护。

当DOMPurify检测到样式注释中包含类似HTML标签的结构时，出于安全考虑，它会选择移除整个样式节点而非冒险允许潜在的危险内容通过。这是一种"宁可错杀，不可放过"的安全策略。

解决方案

项目维护者建议采用以下两种解决方案：

使用净化钩子(Hook)：通过uponSanitizeElement钩子在净化前预处理内容。当检测到样式元素时，可以使用正则表达式预先移除所有注释内容，从而避免触发安全机制。
注释预处理：在内容进入DOMPurify前，先对样式注释进行清理，移除其中可能被误认为HTML标签的文本结构。