BRPC中MultiDimension<bvar::LatencyRecorder>的Prometheus格式兼容性问题分析

2025-05-14 09:56:41作者：牧宁李

brpc is an Industrial-grade RPC framework using C++ Language, which is often used in high performance system such as Search, Storage, Machine learning, Advertisement, Recommendation etc. "brpc" means "better RPC".

项目地址：https://gitcode.com/gh_mirrors/brpc6/brpc

在分布式系统监控领域，Prometheus已经成为事实上的标准监控方案。作为百度开源的优秀RPC框架，BRPC内置了强大的metrics采集能力，但其默认的Prometheus格式输出与标准规范存在一定差异，特别是在使用MultiDimensionbvar::LatencyRecorder进行多维度延迟监控时表现尤为明显。

问题现象

当开发者使用MultiDimensionbvar::LatencyRecorder自定义监控埋点时，BRPC输出的Prometheus格式数据会将完整的指标名称与标签混合在一起。例如输出为：

server_latency{db_id="112",shard_id="2",method="fetch",stage="next",quantile="80"} 4076

而标准的Prometheus格式期望的是将指标名称与标签分离，统一指标名称后通过标签区分不同维度，如下所示：

server_latency{db_id="112",shard_id="2",method="fetch",stage="next",quantile="80"} 4076

技术背景

Prometheus的metrics格式规范要求：

指标名称应该简明扼要地描述被测量的内容
所有维度信息应该通过标签(label)来体现
相同指标的不同维度应该共享相同的指标名称
HELP和TYPE声明应该针对指标名称而非特定维度

BRPC当前的实现方式会导致Prometheus服务端存储大量重复的指标定义，增加存储压力，同时也不利于后续的查询和聚合操作。

影响分析

这种格式差异会带来多方面影响：

监控数据存储效率下降 - Prometheus需要为每个维度组合存储独立的指标定义
查询复杂度增加 - 用户需要处理大量相似但不完全相同的指标名称
可视化工具兼容性问题 - 部分仪表板工具可能无法正确处理这种非标准格式
资源消耗增加 - 服务端需要处理更多的指标定义信息

解决方案建议

从技术实现角度，建议BRPC进行以下优化：

指标名称规范化处理将完整的指标路径转换为标准Prometheus格式，保持指标名称不变，将所有维度信息放入标签
HELP/TYPE声明优化为每个指标名称统一输出HELP和TYPE声明，而不是为每个维度组合重复输出
标签值转义处理确保标签值中的特殊字符被正确转义，符合Prometheus格式规范
指标类型一致性保证确保相同指标名称下的所有数据点具有相同的指标类型

实现原理

在BRPC内部，这涉及到对bvar导出逻辑的修改：

解析原始指标名称，分离出基础名称和维度标签
对MultiDimension指标进行特殊处理，识别其中的维度信息
按照Prometheus规范重组指标名称和标签
优化HELP和TYPE信息的生成逻辑

兼容性考虑

在实现改进时需要特别注意：

保持与现有监控系统的兼容性
提供配置选项控制输出格式
确保性能不受显著影响
完善相关文档说明

这种改进将使BRPC的监控输出更加规范，更好地融入云原生监控体系，同时提升监控数据的存储和查询效率。对于已经深度使用BRPC监控的用户，建议分阶段进行迁移，确保监控系统的平稳过渡。

brpc

项目地址：https://gitcode.com/gh_mirrors/brpc6/brpc

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

leetcode

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.37 K

781

BRPC中MultiDimension<bvar::LatencyRecorder>的Prometheus格式兼容性问题分析

问题现象

技术背景

影响分析

解决方案建议

实现原理

兼容性考虑

热门内容推荐

最新内容推荐

项目优选

BRPC中MultiDimension<bvar::LatencyRecorder>的Prometheus格式兼容性问题分析

问题现象

技术背景

影响分析

解决方案建议

实现原理

兼容性考虑

相关内容推荐

热门内容推荐

最新内容推荐

项目优选