HertzBeat监控系统中实现消息分类通知的技术方案

2025-06-03 11:10:46作者：廉皓灿Ida

背景与需求分析

在现代分布式系统监控场景中，一个统一的监控中心往往需要管理多个不同业务线的服务监控。这些服务通常由不同的运维团队负责维护，因此监控告警消息需要能够精准地路由到对应的责任人，而不是简单地广播给所有相关人员。HertzBeat作为一款开源监控系统，在1.6.1版本中已经提供了基础的通知策略功能，但用户反馈现有机制尚不能满足细粒度的消息分类通知需求。

核心问题剖析

通过对用户反馈的分析，我们可以识别出两个关键的技术需求点：

监控项级别的接收人配置：用户希望在创建每个监控任务时，能够直接指定该监控项的告警接收人
基于标签的消息路由：用户期望在消息通知配置中增加标签筛选功能，通过标签系统实现消息的自动分类和定向发送

技术实现方案

方案一：监控项关联接收人

在监控项创建页面增加接收人配置字段，技术上需要考虑：

数据库层面扩展监控项表结构，增加接收人字段（可设计为JSON数组格式存储多个接收人）
API接口需要新增接收人参数
告警引擎需要修改告警触发逻辑，优先使用监控项级别的接收人配置

// 伪代码示例：监控项实体扩展
public class Monitor {
    private Long id;
    private String name;
    // 新增接收人配置
    private List<String> receivers;
    // 其他原有字段...
}

方案二：基于标签的通知策略

在现有通知策略基础上增强标签过滤功能：

为监控项增加标签系统（可复用现有标签功能或新建关联表）
通知策略配置界面增加标签匹配条件
告警触发时执行标签匹配逻辑，确定最终接收人

-- 伪SQL：标签关联表设计
CREATE TABLE monitor_tags (
    monitor_id BIGINT,
    tag_id BIGINT,
    PRIMARY KEY (monitor_id, tag_id)
);

实现建议与最佳实践

对于HertzBeat项目，推荐采用以下实施路径：

优先完善标签系统：构建完善的监控项标签体系，为后续各种分类功能打下基础
分阶段实现：
- 第一阶段：实现基础标签与通知策略的关联
- 第二阶段：增加监控项级别的接收人覆盖功能
保持向后兼容：确保新增功能不影响现有通知策略的使用

技术难点与解决方案

性能考量：
- 对于大规模监控项，实时标签匹配可能带来性能压力
- 解决方案：采用异步处理机制，或预先生成监控项-接收人映射关系
配置冲突处理：
- 当监控项接收人与策略接收人配置冲突时，需要明确的优先级规则
- 建议：提供配置选项，允许用户设置默认优先策略

总结

HertzBeat监控系统通过增强消息通知的路由能力，可以更好地适应企业级监控场景中多团队协作的需求。实现消息分类通知不仅能提高告警处理的效率，也能减少不必要的消息干扰。建议开发团队考虑在后续版本中逐步实现这些增强功能，同时保持系统的简洁性和易用性。

hertzbeat

An open source, real-time monitoring system with custom-monitoring, high performance cluster, prometheus-like and agentless.

项目地址：https://gitcode.com/gh_mirrors/he/hertzbeat

登录后查看全文

项目优选

收起

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

358

219

MindSpeed-MM

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

TorchAir 支持用户基于PyTorch框架和torch_npu插件在昇腾NPU上使用图模式进行推理。