OpenTelemetry Collector 中 journald 接收器的多行日志处理问题解析

2025-06-23 19:28:40作者：温玫谨Lighthearted

问题背景

在使用 OpenTelemetry Collector 处理 journald 日志时，开发人员遇到了多行日志无法正确合并的问题。具体表现为当日志包含堆栈跟踪等多行内容时，系统无法将这些行正确地组合成一个完整的日志条目。

问题现象

日志处理流程配置如下：

从 journald 接收日志
通过路由将日志分发到不同的解析器
使用正则表达式解析器提取日志字段
尝试通过 recombine 操作符合并多行日志

预期结果是当日志不以日期开头时，应该与前一行的日志合并。但实际结果是只有第一行日志被正确解析和处理，后续的多行内容被单独处理，导致日志信息被分割。

根本原因分析

经过深入排查，发现问题出在 recombine 操作符的配置上。原始配置中使用了 combine_field: body.MESSAGE，而实际上应该使用 combine_field: body.message。这个大小写的差异导致了字段匹配失败。

解决方案

正确的配置应该将 recombine 操作符的 combine_field 参数与正则表达式解析器中定义的字段名完全一致。在正则表达式解析器中，字段被定义为小写的 message，因此 recombine 操作符也应该使用相同的大小写形式。

修正后的配置如下：

- type: recombine
  id: handle_multiline
  combine_field: body.message  # 注意这里改为小写
  combine_with: "\n"
  is_first_entry: body.MESSAGE matches "^\\d{4}-\\d{2}-\\d{2}.*"
  source_identifier: body.SYSLOG_IDENTIFIER
  output: add_multiline_tag

技术要点

字段名大小写敏感：在 OpenTelemetry Collector 的配置中，字段名是大小写敏感的，必须与解析器输出的字段名完全一致。
recombine 操作符工作原理：recombine 操作符通过指定的字段来识别和组合多行日志。它会检查每条日志是否匹配 is_first_entry 条件，然后根据 source_identifier 将相关的日志行组合在一起。
日志处理流程：正确的日志处理流程应该是：接收→路由→解析→合并→输出。每个步骤的输出字段必须与下一步骤的输入字段匹配。