CodeQL中检测数据流路径中特定节点存在的技术方案

2025-05-28 18:14:15作者：殷蕙予

在静态代码分析领域，CodeQL作为强大的查询语言，能够帮助我们识别代码中的各种安全问题和数据流模式。本文将深入探讨如何在CodeQL中检测数据流路径中是否存在满足特定条件的中间节点。

问题背景

在JavaScript代码分析中，我们经常需要验证数据流路径是否经过特定的处理函数。例如，考虑以下代码片段：

source1 = window.location
source2 = window.location
sanitized = sanitizer(source2)
sink1 = eval(source1)
sink2 = eval(sanitized)

这里有两个数据流路径：一个直接从window.location流向eval，另一个则经过了sanitizer函数的处理。我们需要准确识别出经过特定处理函数的数据流路径。

传统解决方案

传统的污点分析方法通常采用两种策略：

默认标记所有源为污点，当流经特定函数时清除污点标记
默认不标记源，当流经特定函数时添加标记

这两种方法虽然有效，但有时我们需要更灵活地检查数据流路径中是否存在特定节点。

现代CodeQL解决方案

CodeQL的最新版本推荐使用流状态(Flow States)机制来处理这类问题。流状态允许我们在数据流分析过程中动态改变污点状态，提供了更精确的控制能力。

流状态实现方案

通过定义流状态，我们可以：

在数据流开始时设置初始状态
在流经特定函数时改变状态
在sink点检查所需状态

这种方法比传统的污点分析更加灵活和精确，能够处理更复杂的数据流场景。

替代方案注意事项

虽然CodeQL曾经提供了MidPathNode类来直接检查中间节点，但这一机制已被标记为废弃。在旧版本中，可以通过以下方式使用：

override predicate hasFlowPath(DataFlow::SourcePathNode source, DataFlow::SinkPathNode sink) {
  exists(DataFlow::MidPathNode first |
    source.getConfiguration() = this and
    somePredicate(first.getNode) and
    source.getASuccessor() = first and
    not exists(DataFlow::MidPathNode mid | mid.getASuccessor() = first) and
    first.getASuccessor*() = sink
  )
}

但这种方案不再推荐使用，因为它属于旧版JavaScript特定实现，未来版本可能会完全移除。