首页
/ Swagger-JS 安全修复:多项式正则表达式处理不受控数据问题

Swagger-JS 安全修复:多项式正则表达式处理不受控数据问题

2025-06-29 09:38:23作者:邬祺芯Juliet

在 Swagger-JS 项目中,开发团队最近修复了一个重要的安全问题,该问题涉及使用多项式时间复杂度的正则表达式处理不受控的用户输入数据。这类问题在 Web 安全领域被称为"正则表达式处理性能"问题,可能导致服务性能下降。

问题背景

正则表达式处理性能问题是一种通过构造特定输入使正则表达式引擎进入长时间计算状态的情况。当正则表达式具有某些特定模式时,某些输入可能使匹配过程需要更多时间才能完成。

在 Swagger-JS 的早期版本中,用于解析 OpenAPI 路径模板的正则表达式存在这类潜在问题。路径模板是 OpenAPI 规范中用于标记 URL 路径中可替换部分的一种语法,使用花括号({})包围的表达式表示。

技术分析

原始实现中使用的正则表达式可能存在性能问题,特别是在处理某些特殊构造的输入时。经过团队分析,解决方案是使用一个优化后的正则表达式模式:

/\{([^{}]+)}|([^{}]+)/g

这个改进后的正则表达式具有以下特点:

  1. 明确限定花括号内的内容只能是非花括号字符([^{}]+)
  2. 使用简单的选择结构(|)处理两种情况:带花括号的模板表达式或不带花括号的普通文本
  3. 全局匹配标志(g)确保能处理字符串中的所有匹配项

配套的处理逻辑也相应调整为:

while ((text = re.exec(str))) {
  if (text[1]) results.push(text[1]);
}
return results;

这种实现确保了正则表达式的匹配时间是线性的,不会出现性能下降的情况。

修复影响

此次修复带来了一些行为上的变化:

  1. 严格遵循 OpenAPI 规范,路径模板表达式现在只允许出现在 URL 路径段中
  2. 不再处理查询字符串或片段标识符中的类似模板的表达式(如/path?offset={offset}#{limit})
  3. 提高了路径模板解析的准确性和一致性

最佳实践建议

对于开发者处理类似路径模板解析的场景,建议:

  1. 避免使用复杂的正则表达式处理用户提供的输入
  2. 明确限定模板表达式的允许位置和内容
  3. 考虑使用专门的库(如openapi-path-templating)来处理标准化的模板语法
  4. 对正则表达式进行性能评估,特别是那些处理用户输入的部分

Swagger-JS 团队通过这次修复,不仅解决了具体的问题,也为开发者提供了处理类似场景的良好范例。在构建需要处理用户提供模板或类似结构的系统时,这些经验值得借鉴。

登录后查看全文

项目优选

收起
leetcodeleetcode
🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer(第 2 版)》、《程序员面试金典(第 6 版)》题解
Java
51
15
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
572
415
ohos_react_nativeohos_react_native
React Native鸿蒙化仓库
C++
125
208
openGauss-serveropenGauss-server
openGauss kernel ~ openGauss is an open source relational database management system
C++
76
146
cherry-studiocherry-studio
🍒 Cherry Studio 是一款支持多个 LLM 提供商的桌面客户端
TypeScript
435
39
openHiTLSopenHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
98
253
MateChatMateChat
前端智能化场景解决方案UI库,轻松构建你的AI应用,我们将持续完善更新,欢迎你的使用与建议。 官网地址:https://matechat.gitcode.com
693
91
folibfolib
FOLib 是一个为Ai研发而生的、全语言制品库和供应链服务平台
Java
74
5
CS-BooksCS-Books
🔥🔥超过1000本的计算机经典书籍、个人笔记资料以及本人在各平台发表文章中所涉及的资源等。书籍资源包括C/C++、Java、Python、Go语言、数据结构与算法、操作系统、后端架构、计算机系统知识、数据库、计算机网络、设计模式、前端、汇编以及校招社招各种面经~
119
14
Cangjie-ExamplesCangjie-Examples
本仓将收集和展示高质量的仓颉示例代码,欢迎大家投稿,让全世界看到您的妙趣设计,也让更多人通过您的编码理解和喜爱仓颉语言。
Cangjie
298
1.03 K