Malcolm项目中Zeek日志JSON格式下Mandiant威胁情报源解析问题分析

2025-07-04 00:42:07作者：裴锟轩Denise

Malcolm is a powerful, easily deployable network traffic analysis tool suite for full packet capture artifacts (PCAP files), Zeek logs and Suricata alerts.

项目地址：https://gitcode.com/gh_mirrors/ma/Malcolm

在网络安全监控领域，Malcolm作为一个开源的网络流量分析平台，其核心组件Zeek（前称Bro）通过日志记录网络活动中的威胁情报匹配情况。近期在测试v24.11.0版本时，发现当采用JSON格式输出Zeek日志时，来自Mandiant威胁情报源的字段解析存在技术缺陷，这值得安全分析人员深入了解。

问题现象

当系统配置为JSON日志格式（通过zeek.env中的ZEEK_JSON=true启用）并加载Mandiant威胁情报源时，生成的intel.log中sources字段会出现异常格式。例如原本应该分开的"Mandiant"和其URL会被错误合并为"Mandiant|https://..."这样的字符串，而非预期的独立字段。

技术根因

深入分析日志处理流程后发现问题源于Logstash解析管道的设计缺陷。在1029_zeek_intel.conf配置文件中，对sources字段的管道处理采用简单的"|"符号分割，但未考虑JSON格式下该字段可能已是数组结构的情况。当前实现存在两个关键问题：

数据类型不匹配：当sources字段在JSON中已是数组时，直接应用split过滤器会导致类型冲突
处理逻辑单一化：未对不同输入格式（文本日志vs JSON）做差异化处理

解决方案

正确的实现应该采用Ruby代码块进行智能处理，其逻辑应包含：

输入类型检测（字符串或数组）
对字符串类型执行split操作
对数组类型保持原样或进行元素级处理
统一输出为标准化数组格式

示例伪代码逻辑：

filter {
  ruby {
    code => '
      if event.get("[sources]").is_a?(String)
        event.set("[sources]", event.get("[sources]").split("|")) 
      elsif event.get("[sources]").is_a?(Array)
        event.set("[sources]", event.get("[sources]").flat_map { |x| x.split("|") })
      end
    '
  }
}