HertzBeat 指标收集系统架构深度解析

2025-06-03 00:59:56作者：尤辰城Agatha

An open source, real-time monitoring system with custom-monitoring, high performance cluster, prometheus-like and agentless.

项目地址：https://gitcode.com/gh_mirrors/he/hertzbeat

概述

HertzBeat 是一款开源的实时监控系统，其核心功能之一就是高效地收集各类监控指标。本文将深入剖析 HertzBeat 指标收集系统的架构设计和工作原理，帮助开发者理解其内部运行机制。

系统架构总览

HertzBeat 的指标收集系统采用分层设计，主要包含以下几个核心组件：

收集调度模块(Collector Scheduler)：负责管理和调度所有收集任务
指标收集队列(MetricsCollectorQueue)：作为任务缓冲区，平衡负载
收集工作线程(Collector Workers)：实际执行指标收集的核心单元
外部监控目标(External Targets)：被监控的各种服务和系统
任务管理系统(Job Management)：维护收集任务的完整生命周期
数据处理管道(Data Processing Pipeline)：对收集到的原始数据进行加工处理

详细工作流程

1. 系统初始化阶段

当 HertzBeat 启动时，收集系统会经历以下初始化过程：

调度器初始化(SchedulerInit)：建立收集器的基本运行环境
注册所有可用的收集器类型
初始化定时任务调度框架
加载持久化的收集任务配置

2. 任务调度过程

任务调度是收集系统的核心控制逻辑：

一致性哈希分配：使用一致性哈希算法将任务均匀分配到各个收集器
定时触发机制：基于时间轮的定时调度确保收集频率的准确性
任务队列管理：通过多级队列实现任务优先级和负载均衡

// 伪代码示例：任务调度核心逻辑
public void scheduleJob(Monitor monitor) {
    // 1. 根据监控类型选择收集器
    Collector collector = selectCollector(monitor.getType());
    
    // 2. 创建收集任务
    CollectJob job = createCollectJob(monitor);
    
    // 3. 将任务加入调度队列
    jobQueue.add(job);
}

3. 指标收集执行

实际的指标收集过程采用生产者-消费者模式：

生产者：调度器不断将任务放入队列
消费者：工作线程从队列获取任务并执行
结果处理：收集到的数据经过清洗后进入存储和告警管道

关键技术实现

1. 时间轮定时器

HertzBeat 使用 HashedWheelTimer 实现高效的任务调度：

将时间划分为多个槽(slot)
每个槽对应一个任务链表
指针按固定间隔移动，执行当前槽的所有任务

这种设计特别适合大量定时任务的场景，时间复杂度接近 O(1)。

2. 负载均衡策略

系统采用多种策略确保负载均衡：

静态分配：基于监控类型的固定分配
动态调整：根据收集器负载情况实时调整
故障转移：当某个收集器不可用时自动切换

3. 数据处理流程

收集到的原始数据会经过以下处理阶段：

数据解析：将原始响应转换为结构化数据
指标提取：从结构化数据中提取关键指标
单位转换：统一指标单位和格式
阈值检查：触发预定义的告警规则
持久化存储：写入时间序列数据库

性能优化设计

HertzBeat 在指标收集方面做了多项优化：

批量收集：对同一主机的多个指标一次性收集
连接复用：保持长连接减少握手开销
本地缓存：缓存不常变的监控数据
异步IO：使用NIO提高网络吞吐量
压缩传输：对大数据量指标进行压缩

扩展性设计

系统架构支持多种扩展方式：

插件式收集器：通过实现标准接口添加新协议支持
自定义脚本：支持JavaScript等脚本语言编写收集逻辑
外部采集模块：可以部署独立采集模块并通过API上报数据
协议适配层：抽象不同监控协议的差异

最佳实践建议

基于对HertzBeat收集系统的理解，我们建议：

合理设置收集频率：根据指标重要性平衡实时性和系统负载
分组监控目标：将同类型目标分配到相同收集器提高效率
监控收集器健康：设置收集器自身的监控指标
优化网络拓扑：让收集器尽量靠近被监控目标
定期审查任务：清理不再需要的监控项

总结

HertzBeat 的指标收集系统通过精心设计的分层架构和多种优化技术，实现了高效、可靠的监控数据采集。理解其内部工作原理有助于用户更好地配置和使用系统，也为开发者扩展功能提供了清晰的方向。随着项目的发展，这套收集系统将继续演进，支持更多监控场景和更高效的采集方式。

An open source, real-time monitoring system with custom-monitoring, high performance cluster, prometheus-like and agentless.

项目地址：https://gitcode.com/gh_mirrors/he/hertzbeat

登录后查看全文

热门内容推荐

1 【亲测免费】开源项目 `build-your-own-x` 使用指南 2 【亲测免费】探索科技之旅：《Build Your Own X》项目详解 3 GitHub_Trending/bu/build-your-own-x自动化：CI/CD流程在自制项目中的应用 4 从零打造智能家居系统：用build-your-own-x实现家庭自动化

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

flutter_flutter

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

昇腾LLM分布式训练框架

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

ohos_react_native

React Native鸿蒙化仓库