OpenTelemetry .NET中Prometheus导出器的单位后缀问题解析

2025-06-24 18:13:28作者：魏侃纯Zoe

在OpenTelemetry .NET生态系统中，Prometheus导出器是一个重要的组件，它允许将应用程序的遥测数据以Prometheus兼容的格式暴露出来。然而，近期在1.8.0版本中引入的一个变更导致了一些指标名称与单位后缀的兼容性问题，这个问题特别影响了使用运行时指标和数据库客户端指标的应用程序。

问题背景

Prometheus对于指标名称有着严格的命名规范，特别是当指标包含单位时。规范要求单位必须作为指标名称的后缀出现。例如，一个测量字节大小的指标应该命名为"something_bytes"。

在OpenTelemetry .NET 1.8.0版本中，Prometheus导出器默认会为计数器类型的指标添加"_total"后缀。这个变更导致了一些内置指标（如GC分配大小和数据库操作字节数）的名称结构被破坏，进而触发了Prometheus的验证错误。

技术细节

问题的核心在于指标名称的构建方式。以GC分配大小指标为例：

原始指标名称：process.runtime.dotnet.gc.allocations.size
单位：bytes
预期Prometheus格式：process_runtime_dotnet_gc_allocations_size_bytes
实际导出格式：process_runtime_dotnet_gc_allocations_size_bytes_total

可以看到，"_total"后缀被添加在了单位之后，这违反了Prometheus的命名规范，导致验证失败。

解决方案

OpenTelemetry团队提供了两种解决方式：

配置选项：从1.8.0-beta.1版本开始，可以通过设置DisableTotalNameSuffixForCounters选项来禁用计数器类型的"_total"后缀添加：

AddPrometheusExporter(o => o.DisableTotalNameSuffixForCounters = true)

版本回退：暂时回退到1.7.0版本，等待更完善的解决方案。

深入分析

这个问题实际上反映了两个不同规范之间的冲突：

OpenTelemetry规范鼓励将单位作为指标名称的一部分
Prometheus规范要求计数器类型指标以"_total"结尾

当前的实现优先考虑了Prometheus的计数器命名规范，但忽略了单位后缀的要求。更完善的解决方案可能需要：

在添加"_total"后缀前检查单位后缀
调整单位在指标名称中的位置
提供更灵活的命名策略配置

最佳实践建议

对于受影响的用户，建议采取以下措施：

评估是否真的需要"_total"后缀（许多Prometheus用户已经习惯了这个约定）
如果不需要，明确禁用该功能以获得更清晰的指标名称
监控OpenTelemetry的更新，等待更完善的命名策略实现
在过渡期间，考虑使用指标重写规则来处理不兼容的指标名称

这个问题虽然看起来是小的命名问题，但它实际上涉及到了不同监控系统之间指标规范的协调，是分布式系统可观测性领域的一个典型挑战。

opentelemetry-dotnet

The OpenTelemetry .NET Client

项目地址：https://gitcode.com/gh_mirrors/op/opentelemetry-dotnet

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

Dart

1.04 K

271