DOMPurify 3.0.10版本中自定义元素标签匹配的缺陷分析与修复

2025-05-15 21:30:24作者：范垣楠Rhoda

DOMPurify - a DOM-only, super-fast, uber-tolerant XSS sanitizer for HTML, MathML and SVG. DOMPurify works with a secure default, but offers a lot of configurability and hooks. Demo:

项目地址：https://gitcode.com/gh_mirrors/do/DOMPurify

问题背景

DOMPurify是一个广受欢迎的HTML净化库，用于防止XSS攻击。在3.0.10版本中，其自定义元素标签的匹配逻辑存在一个缺陷，导致包含下划线的自定义元素无法被正确识别。

问题分析

在HTML5规范中，自定义元素名称需要满足特定格式要求：

必须以小写字母开头
必须包含连字符(-)
可以包含字母、数字、连字符(-)、下划线(_)和点号(.)

然而，DOMPurify 3.0.10版本中使用的正则表达式/^[a-z][a-z\d]*(-[a-z\d]+)+$/i存在以下限制：

不允许在标签名称中使用下划线(_)和点号(.)
强制要求连字符(-)后必须跟随至少一个字母或数字

这种限制与HTML5规范不符，导致像customtag-my-custom-element_v1这样包含下划线的合法自定义元素被错误地拒绝。

技术细节

原始正则表达式分解：

^[a-z]：以小写字母开头
[a-z\d]*：可选的字母或数字
(-[a-z\d]+)+：一个或多个由连字符开头并跟随至少一个字母/数字的片段
$/i：不区分大小写

这个表达式的问题在于：

缺少对下划线(_)和点号(.)的支持
连字符后的内容限制过于严格

解决方案讨论

经过社区讨论，提出了几个改进方案：

初步建议：/^[a-z][_a-z\d]*(-_[a-z\d]+)+$/i
- 添加了对下划线的支持
- 但仍不够完善
基于规范的完整方案：/^([a-z])([-._a-z\d]*)(\-)([-._a-z\d]*)$/i
- 完全遵循HTML5规范
- 但存在正则表达式拒绝服务(ReDoS)风险
最终安全方案：/^[a-z][.\w]*(-[.\w]+)+$/i
- 使用\w字符类(等价于[a-zA-Z0-9_])
- 明确包含点号(.)
- 避免了ReDoS风险
- 保持了良好的性能

实现意义

这个修复使得DOMPurify能够：

正确识别包含下划线的自定义元素
保持与HTML5规范的一致性
不影响安全性
维持良好的性能表现

对于开发者而言，这意味着他们可以在使用DOMPurify时，放心地使用符合规范的各种自定义元素名称，而不用担心被错误地过滤掉。

结论

DOMPurify团队对社区反馈响应迅速，通过这次修复进一步提升了库的兼容性和规范性。这也提醒我们，即使是成熟的安全库，也需要持续关注规范变化和实际使用场景，及时进行调整和完善。

DOMPurify - a DOM-only, super-fast, uber-tolerant XSS sanitizer for HTML, MathML and SVG. DOMPurify works with a secure default, but offers a lot of configurability and hooks. Demo:

项目地址：https://gitcode.com/gh_mirrors/do/DOMPurify

登录后查看全文

热门内容推荐

1 编程实践项目探索指南：从零构建技术能力体系 2 技术解构式学习：从0到1构建你的编程知识体系 3 构建自己的技术世界：build-your-own-x项目的实践探索指南 4 解锁编程技能的实践之旅：从零构建你的技术世界 5 技术实践探索：从零开始构建核心系统的实践指南 6 亲手锻造技术引擎：从0到1构建核心系统的实践指南

最新内容推荐

AcFunDown视频下载工具完全指南还在为数字笔记抓狂？这款开源神器让手写批注效率提升300%Windows笔记本电池健康管理全指南：从根源解决电池损耗问题 gmx_MMPBSA分子间相互作用索引错误的深度诊断与解决 Axure RP 11 本地化方案：Mac中文界面优化与原型设计工具汉化全指南如何高效获取教育资源？这款工具让教材下载效率提升80%视频元数据深度编辑：专业技巧与案例网盘直链下载技术解析与应用指南如何用DeepSeek-R1推理模型提升复杂任务解决能力：完整指南 5个突破瓶颈技巧：硬件优化工具让你的电脑性能提升30%

项目优选

收起

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

deepin linux kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。