首页
/ OpenTelemetry Collector Contrib 中 Azure Front Door WAF 日志处理优化

OpenTelemetry Collector Contrib 中 Azure Front Door WAF 日志处理优化

2025-06-23 20:28:49作者:钟日瑜

在 OpenTelemetry Collector Contrib 项目中,针对 Azure Front Door Web Application Firewall (WAF) 日志的处理方式进行了重要优化。本文将详细介绍这项改进的技术细节和实现方案。

背景与问题分析

Azure Front Door WAF 日志记录了网络安全防护事件的关键信息,包括客户端IP、请求URI、规则匹配情况等。在现有实现中,这些有价值的信息被整体存储在日志记录的 body 属性中,导致以下问题:

  1. 查询效率低下:无法直接通过属性进行过滤和查询
  2. 标准化程度不足:字段命名不符合 OpenTelemetry 语义约定
  3. 解析成本高:下游系统需要额外处理才能提取关键信息

技术解决方案

新的处理方案将这些关键字段从 body 中提取出来,转换为标准的日志记录属性。具体转换规则如下:

原始字段 转换后属性 说明
clientIP client.address 客户端IP地址
clientPort client.port 客户端端口号
socketIP source.address 连接源IP地址
requestUri url.original 完整请求URL
ruleName azure.frontdoor.waf.rule 触发的WAF规则名称
policy azure.frontdoor.waf.policy.name 应用的WAF策略名称
action azure.frontdoor.waf.action WAF采取的动作
host http.request.header.host 请求头中的Host值
trackingReference azure.ref Azure跟踪参考号
policyMode azure.frontdoor.waf.policy.mode 策略模式

特别值得注意的是对 requestUri 的处理,不仅保留了原始URL,还进行了细粒度解析:

  1. url.scheme:提取协议类型(http/https)
  2. url.fragment:提取片段标识符
  3. url.query:提取查询参数
  4. url.path:提取路径部分
  5. url.port:提取端口号

实现效果对比

优化后的日志记录结构更加清晰,查询能力显著提升。以下是新旧实现的对比:

旧实现将所有信息嵌套存储在body中:

body:
  kvlistValue:
    values:
      - key: properties
        value:
          kvlistValue:
            values:
              - key: clientIP
                value: "2001:1c00:3280..."

新实现将关键信息提取为顶级属性:

attributes:
  - key: client.address
    value: "2001:1c00:3280..."
body: {}

技术价值

这项改进带来了多方面的技术优势:

  1. 查询性能提升:属性化存储使得日志系统可以直接索引这些字段
  2. 标准化兼容:遵循OpenTelemetry语义约定,便于与其他系统集成
  3. 维护性增强:明确的结构定义降低了后续维护成本
  4. 资源节约:减少了下游系统的解析处理负担

未来展望

虽然当前实现已经处理了主要字段,但仍有优化空间:

  1. details字段中的匹配信息可以进一步结构化
  2. 考虑添加更多Azure特有的诊断信息
  3. 完善错误处理机制,确保数据完整性

这项改进为Azure日志处理树立了良好范例,后续可推广到其他Azure日志类别的处理中。

登录后查看全文
热门项目推荐

热门内容推荐

最新内容推荐

项目优选

收起
docsdocs
OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
143
1.92 K
kernelkernel
deepin linux kernel
C
22
6
nop-entropynop-entropy
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
8
0
ohos_react_nativeohos_react_native
React Native鸿蒙化仓库
C++
192
274
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
929
553
openHiTLSopenHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
422
392
openGauss-serveropenGauss-server
openGauss kernel ~ openGauss is an open source relational database management system
C++
145
189
金融AI编程实战金融AI编程实战
为非计算机科班出身 (例如财经类高校金融学院) 同学量身定制,新手友好,让学生以亲身实践开源开发的方式,学会使用计算机自动化自己的科研/创新工作。案例以量化投资为主线,涉及 Bash、Python、SQL、BI、AI 等全技术栈,培养面向未来的数智化人才 (如数据工程师、数据分析师、数据科学家、数据决策者、量化投资人)。
Jupyter Notebook
75
65
Cangjie-ExamplesCangjie-Examples
本仓将收集和展示高质量的仓颉示例代码,欢迎大家投稿,让全世界看到您的妙趣设计,也让更多人通过您的编码理解和喜爱仓颉语言。
Cangjie
344
1.3 K
easy-eseasy-es
Elasticsearch 国内Top1 elasticsearch搜索引擎框架es ORM框架,索引全自动智能托管,如丝般顺滑,与Mybatis-plus一致的API,屏蔽语言差异,开发者只需要会MySQL语法即可完成对Es的相关操作,零额外学习成本.底层采用RestHighLevelClient,兼具低码,易用,易拓展等特性,支持es独有的高亮,权重,分词,Geo,嵌套,父子类型等功能...
Java
36
8