SkyWalking中FLAG_NO_RECORDED_VALUE标志处理异常导致指标峰值问题分析

2025-05-08 22:35:55作者：郁楠烈Hubert

开源APM系统，提供分布式追踪、服务拓扑分析、多语言代理支持，集成eBPF监控、告警及AI异常检测，适用于云原生环境下的性能管理与问题诊断。

项目地址：https://gitcode.com/gh_mirrors/sk/skywalking

问题背景

在Apache SkyWalking监控系统中，运维人员观察到监控图表中频繁出现异常的指标峰值。这些峰值表现为数值突然飙升至极大值，但实际系统运行状态并未出现对应异常。经过深入分析发现，这与SkyWalking对FLAG_NO_RECORDED_VALUE标志的处理机制有关。

问题现象

监控图表中周期性出现以下异常特征：

每小时出现一个0值数据点
紧随其后的时间点(T+1)会出现异常高值
实际系统运行状态正常，无对应异常

根本原因

通过代码分析发现，SkyWalking在处理指标数据时存在以下问题：

标志位处理缺失：当指标数据携带FLAG_NO_RECORDED_VALUE标志时，系统未正确识别该标志的含义
默认值处理不当：对于不存在的指标值，系统错误地将其处理为0值而非空值
计算逻辑缺陷：在后续的MAL(监控告警语言)处理和持久化阶段，这些0值被纳入计算

技术细节

FLAG_NO_RECORDED_VALUE标志原本用于表示：

该时间点没有记录到有效指标值
应该被识别为"无数据"状态

但实际处理流程中：

数据收集阶段：携带该标志的数据被错误解析
数据传输阶段：标志信息未被正确传递
数据处理阶段：空值被转换为0值
计算阶段：在计算指标变化率(rate)时，从0到正常值的突变导致计算出异常高值

影响范围

该问题主要影响：

使用OTel(OpenTelemetry)数据源的场景
边缘计算环境
大规模指标监控场景
所有依赖变化率计算的监控指标

解决方案建议

标志位正确处理：
- 在数据解析阶段识别FLAG_NO_RECORDED_VALUE标志
- 将标志信息完整传递至处理流水线
空值处理优化：
- 区分"0值"和"无数据"状态
- 对于无数据情况，保持空值状态
计算逻辑增强：
- 在MAL处理中增加空值检查
- 对变化率计算增加边界条件处理
持久化策略调整：
- 避免将空值指标持久化为0值
- 在存储层增加特殊标记

问题复现

在以下场景可以复现该问题：

OTel数据源暂时不可用
边缘节点网络中断
指标采集间隔不规律

总结

开源APM系统，提供分布式追踪、服务拓扑分析、多语言代理支持，集成eBPF监控、告警及AI异常检测，适用于云原生环境下的性能管理与问题诊断。

项目地址：https://gitcode.com/gh_mirrors/sk/skywalking

登录后查看全文

热门内容推荐

1 【亲测免费】开源项目 `build-your-own-x` 使用指南 2 【亲测免费】探索科技之旅：《Build Your Own X》项目详解 3 GitHub_Trending/bu/build-your-own-x自动化：CI/CD流程在自制项目中的应用 4 从零打造智能家居系统：用build-your-own-x实现家庭自动化

最新内容推荐

Degrees of Lewdity中文汉化终极指南：零基础玩家必看的完整教程 Unity游戏翻译神器：XUnity Auto Translator 完整使用指南 PythonWin7终极指南：在Windows 7上轻松安装Python 3.9+终极macOS键盘定制指南：用Karabiner-Elements提升10倍效率 Pandas数据分析实战指南：从零基础到数据处理高手 Qwen3-235B-FP8震撼升级：256K上下文+22B激活参数 7步搞定机械键盘PCB设计：从零开始打造你的专属键盘终极WeMod专业版解锁指南：3步免费获取完整高级功能 DeepSeek-R1-Distill-Qwen-32B技术揭秘：小模型如何实现大模型性能突破音频修复终极指南：让每一段受损声音重获新生

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

ohos_react_native

React Native鸿蒙化仓库

flutter_flutter

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

昇腾LLM分布式训练框架