Micrometer项目中的ClassicHistogramBuckets负值异常问题解析

2025-06-12 03:46:24作者：宣利权Counsellor

在Spring Boot应用中使用Micrometer进行指标监控时，开发者可能会遇到一个典型问题：当为HTTP服务器请求配置SLO（服务等级目标）后，系统抛出java.lang.IllegalArgumentException: Counts in ClassicHistogramBuckets cannot be negative异常。本文将深入分析该问题的成因、影响范围及解决方案。

问题背景

该异常通常出现在以下场景：

使用Spring Boot 3.3.0 + Micrometer 1.13.0组合

启用了HTTP请求的SLO配置，例如：

management.metrics.distribution.slo.http.server.requests=10ms,25ms,50ms,80ms,110ms,200ms,300ms,450ms,1100ms,6100ms

当Prometheus尝试采集指标数据时触发

技术原理

问题的本质在于直方图桶（Histogram Buckets）的计数验证机制。在Prometheus的指标模型中，ClassicHistogramBuckets要求所有桶的计数值必须为非负数。该验证由prometheus-metrics-model库（版本1.2.1）强制执行。

Micrometer在将分布统计数据转换为Prometheus格式时，可能出现以下情况：

由于并发更新导致中间状态出现负值
长周期指标统计时的数值翻转问题
特定版本中的计算逻辑缺陷

影响范围

该问题具有以下特征：

主要影响使用Prometheus作为监控后端的系统
涉及所有包含分布统计（如直方图、SLO）的指标
在指标采集时（如访问/actuator/prometheus端点）才会触发

解决方案

经过社区验证的修复方案是：

升级Micrometer到1.13.2及以上版本（推荐1.13.4）
确保配套的prometheus-metrics-model库同步更新
对于无法立即升级的系统，可暂时禁用SLO配置

最佳实践

为避免类似问题，建议：

保持Micrometer生态组件版本一致
生产环境使用经过充分验证的稳定版本组合
对监控指标配置进行完整性测试
关注指标采集过程中的并发控制

该问题的修复体现了监控系统中的一个重要原则：指标数据的数学有效性必须得到保证，特别是在分布式和高并发场景下。开发者应当理解监控指标背后的统计模型，才能更好地利用这些工具构建可靠的观测体系。

micrometer

An application observability facade for the most popular observability tools. Think SLF4J, but for observability.

项目地址：https://gitcode.com/gh_mirrors/mi/micrometer

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

leetcode

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.37 K

781