首页
/ CodeQL JavaScript项目中识别中断数据流的未解析调用节点

CodeQL JavaScript项目中识别中断数据流的未解析调用节点

2025-05-28 01:44:27作者:史锋燃Gardner

在CodeQL JavaScript静态分析项目中,开发人员经常需要识别那些导致数据流中断的未解析函数调用节点。这类问题通常出现在分析npm包问题时,特别是当调用图(call graph)中存在无法解析被调用方(callee)的情况。

问题背景

JavaScript的动态特性使得静态分析工具在解析某些函数调用时会遇到困难。CodeQL通过数据流分析追踪变量和值的传播路径,但当遇到无法解析被调用方的函数调用节点(CallNode)时,数据流可能会中断,导致潜在的安全问题被遗漏。

识别未解析调用节点

CodeQL提供了直接查询未解析调用节点的方法:

class UnresolvedCallNode extends DataFlow::CallNode {
  UnresolvedCallNode() {
    not exists(this.getACallee(0))
  }
}

这个类会匹配所有没有解析到被调用方的函数调用节点。但直接使用这个类会包含太多误报,因为CodeQL内置了许多流行API的传播规则,即使没有解析到具体实现,数据流仍能继续。

过滤无关调用节点

我们需要进一步过滤掉那些虽然未解析但CodeQL已经内置了传播规则的调用节点:

class InterestingUnresolvedCallNode extends UnresolvedCallNode {
  InterestingUnresolvedCallNode() {
    not(
      this.getCalleeName() = "require" or
      this.(DataFlow::CallNode).getReceiver().(DataFlow::ExprNode).asExpr().(VarAccess).getVariable().getName() = "console"
    )
  }
}

这个过滤条件排除了require()console相关调用,因为它们通常不会中断数据流。

处理CodeQL内置的传播规则

CodeQL通过两种方式处理未解析调用的数据流传播:

  1. SummarizedCallable:CodeQL内置的通用函数摘要模型
  2. 特定安全配置的附加流步骤:如TaintedPathConfigCodeInjectionConfig中的isAdditionalFlowStep

我们可以通过检查调用节点是否被这些机制覆盖来进一步过滤:

class InterestingUnresolvedCallWithSummary extends InterestingUnresolvedCallNode {
  InterestingUnresolvedCallWithSummary() {
    any(SummarizedCallable summary).getACallSimple() = this
    or
    TPQ::TaintedPathConfig::isAdditionalFlowStep(_, _, this, _)
    or
    CIQ::CodeInjectionConfig::isAdditionalFlowStep(_, this)
  }
}

实际应用:安全问题分析

在实际安全分析中,我们可以将这种技术应用于特定类型的问题检测。例如,在代码注入问题分析中:

module CodeInjectionConfigNew implements DataFlow::ConfigSig {
    predicate isSource = CodeInjectionConfig::isSource/1;
    predicate isSink(DataFlow::Node sink) {
     sink instanceof InterestingUnresolvedCallWithSummary and
     not CodeInjectionConfig::isAdditionalFlowStep(_, sink)
  }
}

这种配置可以帮助我们识别那些真正中断数据流、可能导致问题被遗漏的调用节点。

技术挑战与解决方案

  1. 动态回调函数:JavaScript中常见的回调模式会导致大量调用节点无法解析。解决方案是添加参数流步骤规则:
class ParamStep extends TaintTracking::SharedTaintStep {
  override predicate step(DataFlow::Node nodeFrom, DataFlow::Node nodeTo) {
      nodeTo instanceof DataFlow::InvokeNode
      and not exists(nodeTo.(DataFlow::InvokeNode).getACallee(0))
      and nodeFrom = nodeTo.(DataFlow::InvokeNode).getAnArgument*()
  }
}
  1. 跨配置传播规则:某些调用在一个安全配置中没有传播规则,但在另一个配置中有。需要检查多个配置的isAdditionalFlowStep

最佳实践

  1. 优先使用SummarizedCallable过滤已知传播规则的调用
  2. 对于特定类型的安全分析,检查相关配置的附加流步骤
  3. 考虑JavaScript常见模式(如回调、动态属性访问)对数据流分析的影响
  4. 结合多种技术(如参数流步骤)提高分析的完整性

通过这种方法,开发者可以更精确地识别那些真正影响分析结果的未解析调用节点,从而有针对性地改进分析规则或代码实现。

登录后查看全文
热门项目推荐
相关项目推荐

项目优选

收起
kernelkernel
deepin linux kernel
C
27
11
docsdocs
OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
470
3.48 K
nop-entropynop-entropy
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
10
1
leetcodeleetcode
🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer(第 2 版)》、《程序员面试金典(第 6 版)》题解
Java
65
19
flutter_flutterflutter_flutter
暂无简介
Dart
718
172
giteagitea
喝着茶写代码!最易用的自托管一站式代码托管平台,包含Git托管,代码审查,团队协作,软件包和CI/CD。
Go
23
0
kernelkernel
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
209
84
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
1.27 K
695
rainbondrainbond
无需学习 Kubernetes 的容器平台,在 Kubernetes 上构建、部署、组装和管理应用,无需 K8s 专业知识,全流程图形化管理
Go
15
1
apintoapinto
基于golang开发的网关。具有各种插件,可以自行扩展,即插即用。此外,它可以快速帮助企业管理API服务,提高API服务的稳定性和安全性。
Go
22
1