Fluent Bit 处理 systemd 日志时特殊字符问题的解决方案

2025-06-01 20:34:03作者：苗圣禹Peter

问题背景

在使用 Fluent Bit 收集 Linux 系统日志并转发到 Google Stackdriver 时，系统服务日志中的特殊字符会导致日志转发失败。特别是当 systemd 服务名称中包含"@"符号时（如 postfix@-.service），Stackdriver 会拒绝接收这些日志条目，返回"Log name contains illegal character"错误。

技术分析

这个问题源于两个组件的交互特性：

systemd 服务命名规范：systemd 允许在服务名称中使用"@"符号，这种命名方式常用于模板化服务。例如 postfix@-.service 就是一个典型的模板服务实例。
Stackdriver 日志命名限制：Google Stackdriver 对日志名称有严格的字符限制，不允许使用"@"等特殊字符。
Fluent Bit 默认行为：当使用 systemd 输入插件并设置通配标签（如 host.*）时，Fluent Bit 会自动将 SYSTEMD_UNIT 字段值（包含完整服务名）附加到日志标签中，导致最终生成的 Stackdriver 日志名称包含非法字符。

解决方案

方案一：修改输入标签格式

将 systemd 输入插件的标签从通配格式改为固定值：

[INPUT]
    name systemd
    tag host.systemd  # 改为固定值而非通配符
    DB /var/lib/fluent-bit/journal.db

这种方法避免了将服务名称直接包含在日志标签中，从而绕过了特殊字符问题。但缺点是会丢失服务名称作为标签的一部分，可能影响后续的日志过滤和分类。

方案二：自定义日志处理管道

更完善的解决方案是使用 Fluent Bit 的过滤器链来处理日志：

首先使用 systemd 输入插件收集日志
然后使用修改过滤器处理服务名称
最后输出到 Stackdriver

配置示例：

[INPUT]
    name systemd
    tag systemd.log
    DB /var/lib/fluent-bit/journal.db

[FILTER]
    name modify
    match systemd.log
    Rename _SYSTEMD_UNIT service_name
    Set stackdriver_log_name host.${HOSTNAME}

[OUTPUT]
    name stackdriver
    match *
    google_service_credentials /path/to/credentials.json
    resource gce_instance

这种方案既保留了服务名称信息（存储在 service_name 字段中），又避免了非法字符出现在日志名称中。