HAPI FHIR项目中Nokogiri库的安全问题分析与改进建议

2025-07-04 03:29:20作者：幸俭卉

问题背景

在HAPI FHIR项目的依赖项中，发现了一个涉及Nokogiri库的高危安全问题(CVE-2021-41098)。Nokogiri是一个广泛使用的Ruby库，用于处理HTML、XML等文档，提供XPath和CSS选择器支持。该问题主要影响JRuby环境下的SAX解析器。

问题详情

这个问题的核心是Nokogiri在JRuby环境下默认会处理外部实体。当使用以下类处理不受信任的文档时，可能会受到影响：

Nokogiri::XML::SAX::Parse
Nokogiri::HTML4::SAX::Parser及其别名Nokogiri::HTML::SAX::Parser
Nokogiri::XML::SAX::PushParser
Nokogiri::HTML4::SAX::PushParser及其别名Nokogiri::HTML::SAX::PushParser

风险评估

该问题的CVSS 3.0评分为7.5(高危)，主要风险在于可能通过网络利用此问题，无需特殊权限或用户交互，就能造成高严重性的信息泄露。可能通过精心构造的XML文档实施XXE(XML External Entity)攻击，读取服务器上的重要文件或发起SSRF攻击。

影响范围

该问题影响Nokogiri 1.12.4及更早版本，仅影响JRuby环境下的应用。CRuby(MRI)用户不受此问题影响。在HAPI FHIR项目中，这个问题通过foodcritic工具链引入，具体路径为：guard-foodcritic → foodcritic → nokogiri。

解决方案

针对此问题，Nokogiri官方在1.12.5版本中修复了这个问题。建议采取以下措施：

直接升级Nokogiri到1.12.5或更高版本
如果暂时无法升级，对于JRuby用户，可以考虑以下临时方案：
- 避免使用SAX解析器处理不受信任的输入
- 在使用SAX解析器前，显式禁用外部实体处理功能

最佳实践建议

定期检查项目依赖项的安全状况
建立自动化的依赖项更新机制
对于XML处理相关的功能，特别是处理用户输入时，应当：
- 禁用DTD处理
- 禁用外部实体处理
- 限制XML文档大小
- 使用允许列表验证输入
考虑使用更现代的替代方案处理XML/HTML，如REXML(纯Ruby实现)或其他专门的解析器

总结

XML处理库的安全考虑往往容易被忽视，但却可能成为系统的重要关注点。HAPI FHIR项目中的这个Nokogiri问题提醒我们，即使是间接依赖项也可能引入安全风险。开发团队应当建立完善的依赖项管理机制，及时跟进安全更新，并在设计阶段就考虑安全因素，才能有效降低此类风险。

hapi-fhir

🔥 HAPI FHIR - Java API for HL7 FHIR Clients and Servers

项目地址：https://gitcode.com/gh_mirrors/ha/hapi-fhir

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

nop-entropy

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

349

200

pytorch

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理