OpenTelemetry .NET 中关于指标重复上报问题的技术解析

2025-06-24 05:13:40作者：宗隆裙

在基于 OpenTelemetry .NET SDK 实现指标监控时，开发人员可能会遇到指标数据被重复上报的情况。本文将从技术原理层面深入分析这一现象的原因，并提供相应的解决方案。

问题现象

当使用 OTLP 导出器配合 Azure Functions 上报指标时，会出现以下现象：

相同的指标值每分钟被重复上报
该现象持续到函数应用关闭为止
日志功能工作正常，仅指标出现此问题

核心原因分析

1. 可观测仪表的特性

示例代码中使用了 CreateObservableGauge 创建可观测仪表。这类仪表的特点是：

每次导出时都会调用回调函数获取当前值
默认情况下每分钟执行一次导出操作
回调函数始终返回固定值（示例中的 () => 1）

2. 时间聚合类型的影响

OpenTelemetry 默认使用累积性（Cumulative）时间聚合：

每次导出都包含自应用启动以来的所有数据
即使值未变化也会重复上报
适合 Prometheus 等监控系统

解决方案

方案一：调整时间聚合类型

将聚合类型改为 Delta（增量）模式：

metricReaderOptions.Temporality = AggregationTemporality.Delta

特点：

仅上报两次导出之间的变化量
适合 Azure Monitor 等监控系统
需要配合回调函数逻辑调整

方案二：优化回调函数逻辑

对于可观测仪表，应实现条件返回值：

meter.CreateObservableGauge("aNewMetric", () => 
{
    return shouldReport ? new Measurement<int>(1) : default;
});

方案三：改用直方图类型

对于不需要持续观测的场景，可改用 Histogram：

var histogram = meter.CreateHistogram<int>("aNewMetric");
histogram.Record(value);

最佳实践建议

根据后端监控系统选择合适的时间聚合类型：
- Prometheus：Cumulative（默认）
- Azure Monitor/NewRelic：Delta
可观测仪表设计原则：
- 实现有条件的测量返回值
- 避免返回固定值
- 考虑资源消耗（频繁回调）
生产环境建议：
- 明确指标上报策略
- 测试不同聚合类型的效果
- 监控指标上报量

总结

OpenTelemetry .NET 中指标重复上报的问题主要源于可观测仪表的工作机制和时间聚合类型的默认配置。通过理解这些底层原理，开发者可以灵活选择最适合自己监控场景的解决方案。在实际应用中，建议根据监控后端的特性和业务需求，合理设计指标采集和上报策略。

opentelemetry-dotnet

The OpenTelemetry .NET Client

项目地址：https://gitcode.com/gh_mirrors/op/opentelemetry-dotnet

登录后查看全文

项目优选

收起

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

360

219

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

AscendNPU-IR是基于MLIR（Multi-Level Intermediate Representation）构建的，面向昇腾亲和算子编译时使用的中间表示，提供昇腾完备表达能力，通过编译优化提升昇腾AI处理器计算效率，支持通过生态框架使能昇腾AI处理器与深度调优

C++

161