Fluent Bit中Reserve_Data配置的常见误区与正确使用

2025-06-01 20:11:59作者：邓越浪Henry

问题背景

在使用Fluent Bit进行日志处理时，Reserve_Data是一个重要的配置选项，它决定了在解析日志时是否保留原始数据。然而，很多用户在实际使用中会遇到配置不生效的问题，特别是在使用正则表达式解析器(regex parser)或JSON解析器时。

配置误区分析

通过实际测试案例，我们发现用户经常犯的一个错误是将Reserve_Data配置放在了错误的配置段中。具体表现为：

错误做法：将Reserve_Data On放在[PARSER]配置段中
正确做法：应将Reserve_Data On放在[FILTER]配置段中

测试案例验证

我们通过四个测试案例来验证这一配置行为：

测试案例1：Reserve_Data On + 无字段提取的正则表达式

配置位置正确时：原始数据被完整保留
输出结果包含所有原始字段(key1, key2, key3, message)

测试案例2：Reserve_Data Off + 无字段提取的正则表达式

原始数据同样被保留
说明当正则表达式不提取任何字段时，Reserve_Data设置不影响结果

测试案例3：Reserve_Data On + 有字段提取的正则表达式（错误配置）

当Reserve_Data放在[PARSER]段时
只有提取的字段(testvalue, testmessage)出现在结果中
原始字段(key1, key2, key3)丢失

测试案例4：Reserve_Data Off + 有字段提取的正则表达式

只有提取的字段出现在结果中
这是预期行为

正确配置方法

对于想要在提取新字段的同时保留原始数据的场景，正确的配置方式应该是：

[FILTER]
    Name parser
    Match *
    Key_Name message
    Parser test-regex-parser
    Reserve_Data On

而不是将Reserve_Data放在[PARSER]配置段中。

JSON解析器的相同问题

这个问题不仅限于正则表达式解析器，同样适用于JSON解析器。当使用Decode_Field_As功能解码JSON字段时，如果希望保留原始数据，也应该在[FILTER]段中设置Reserve_Data On。

技术原理

Fluent Bit的解析器工作流程是：

首先由[PARSER]定义解析规则
然后在[FILTER]中应用这些规则并控制数据处理行为

Reserve_Data属于数据处理行为的控制参数，因此应该放在[FILTER]段中，而不是解析规则定义中。

总结

正确理解和使用Fluent Bit的Reserve_Data配置需要注意：

配置位置必须在[FILTER]段，而不是[PARSER]段
该参数控制的是过滤器的数据处理行为，不是解析器的解析规则
适用于所有类型的解析器，包括正则表达式和JSON解析器

通过正确配置，用户可以灵活控制是否在提取新字段的同时保留原始日志数据，满足各种日志处理需求。

fluent-bit

Fast and Lightweight Logs, Metrics and Traces processor for Linux, BSD, OSX and Windows

项目地址：https://gitcode.com/GitHub_Trending/fl/fluent-bit

登录后查看全文

项目优选

收起

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

Rust

578

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Ascend Extension for PyTorch

🍒 Cherry Studio 是一款支持多个 LLM 提供商的桌面客户端

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java