在sanitize-html中安全处理代码片段的正确姿势

2025-06-16 09:02:29作者：柯茵沙

Clean up user-submitted HTML, preserving whitelisted elements and whitelisted attributes on a per-element basis. Built on htmlparser2 for speed and tolerance

项目地址：https://gitcode.com/gh_mirrors/sa/sanitize-html

背景与挑战

在使用sanitize-html进行内容净化时，开发者常遇到一个典型场景：如何正确处理用户提交的代码片段。直接保留<code>标签内的原始内容可能带来XSS风险，而过度过滤又会导致代码显示异常。

HTML转义的核心原则

所有HTML特殊字符必须经过转义处理，这是Web安全的基础准则。在代码展示场景中：

尖括号<应转换为<
大于号>应转换为>
与符号&应转换为&

实现方案对比

code元素方案：
- 适用于内联代码片段
- 保持文本流式布局
- 需配合CSS设置等宽字体
pre元素方案：
- 保留原始格式和换行
- 适合多行代码块
- 默认显示为块级元素

最佳实践建议

前端预处理：
- 在提交到服务器前，使用encodeURIComponent()或专用库处理代码内容
- 可视化编辑器应集成代码转义功能

服务端处理：

const clean = sanitizeHtml(dirtyHtml, {
  allowedTags: [..., 'code', 'pre'],
  allowedAttributes: {
    // 允许必要的属性
  }
});

显示层处理：
- 使用语法高亮库(如Prism.js)需确保其输入是转义后的内容
- 避免直接在innerHTML中插入未转义内容

安全注意事项

永远不要信任客户端提交的数据
即使内容在<code>或<pre>标签内，也必须进行转义
考虑实现二次验证机制，确保转义操作有效执行

扩展建议

对于技术文档平台或博客系统，建议：

建立代码提交规范
实现自动化转义管道
在渲染层添加最终安全检查
对管理员和普通用户实施差异化内容策略

通过这种分层防御策略，可以在保持功能完整性的同时确保系统安全性。

Clean up user-submitted HTML, preserving whitelisted elements and whitelisted attributes on a per-element basis. Built on htmlparser2 for speed and tolerance

项目地址：https://gitcode.com/gh_mirrors/sa/sanitize-html

登录后查看全文

最新内容推荐

AcFunDown视频下载工具完全指南还在为数字笔记抓狂？这款开源神器让手写批注效率提升300%Windows笔记本电池健康管理全指南：从根源解决电池损耗问题 gmx_MMPBSA分子间相互作用索引错误的深度诊断与解决 Axure RP 11 本地化方案：Mac中文界面优化与原型设计工具汉化全指南如何高效获取教育资源？这款工具让教材下载效率提升80%视频元数据深度编辑：专业技巧与案例网盘直链下载技术解析与应用指南如何用DeepSeek-R1推理模型提升复杂任务解决能力：完整指南 5个突破瓶颈技巧：硬件优化工具让你的电脑性能提升30%

项目优选

收起

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

flutter_flutter

Oohos_react_native

React Native鸿蒙化仓库

昇腾LLM分布式训练框架

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统