首页
/ ntopng告警存储架构优化:内存与持久化告警的统一管理

ntopng告警存储架构优化:内存与持久化告警的统一管理

2025-06-02 05:42:32作者:咎岭娴Homer

背景与挑战

ntopng作为一款专业的网络流量监控工具,其告警系统一直采用分离式设计——活跃告警(Engaged)存储在内存中,历史告警(Stored)持久化到数据库。这种架构在实际使用中存在几个显著问题:

  1. 用户需要频繁切换不同视图查看告警状态
  2. 无法对全部告警进行统一排序和筛选
  3. 活跃告警的生命周期管理不够透明
  4. 统计图表无法完整反映系统告警状态

架构改造方案

多级存储引擎设计

项目团队对存储层进行了重构,实现了统一的数据访问接口:

SQLite实现

  • 新增内存数据库表engaged_alerts存储活跃告警
  • 保留原有SQLite表alerts存储历史告警
  • 创建联合视图all_alerts合并两类数据

ClickHouse实现

  • 采用内存表引擎Memory创建engaged_alerts
  • 利用MergeTree引擎的alerts表保持不变
  • 通过视图实现统一查询接口

生命周期管理优化

告警触发流程被重新设计:

  1. 当主机触发告警时,系统会:
    • 调用triggerAlert方法
    • 通过addEngagedAlert将告警写入内存表
  2. 当告警解除时:
    • 调用releaseAlert方法
    • 通过removeEngagedAlert清理内存记录
    • 可选地将告警转存到历史表

查询性能优化

针对大规模部署场景,团队实施了多项性能优化:

  1. 时间范围限定:默认只查询24小时内的活跃告警
  2. 索引优化:确保begin_time字段的索引效率
  3. 批处理操作:减少数据库频繁访问

功能增强点

统一告警视图

新的"全部告警"视图具有以下特点:

  • 合并显示活跃和历史告警
  • 支持按状态筛选(活跃/已确认等)
  • 统一的排序和分页功能
  • 完整的上下文关联操作

交互体验改进

  1. 操作权限控制:

    • 禁用对活跃告警的历史操作
    • 动态调整操作按钮状态
  2. 可视化增强:

    • 时间图表包含持续中的活跃告警
    • 状态标记更加醒目直观
  3. 工作流优化:

    • "需要关注"标签页整合两类告警
    • 简化确认/解除操作流程

技术实现细节

数据库模式演进

存储模式主要变更包括:

  • 新增is_engaged布尔标志字段
  • 增加last_seen时间戳字段
  • 优化索引结构支持混合查询
  • 添加状态枚举字段支持精细过滤

事务处理机制

关键操作都实现了事务保护:

  1. 告警触发/解除的原子性
  2. 状态变更的一致性保证
  3. 批量操作的事务隔离

内存管理策略

针对内存表特别设计:

  • 自动清理过期告警记录
  • 内存使用监控和告警
  • 紧急情况下的降级处理

应用价值

该改造为ntopng带来显著提升:

  1. 运维效率提高:单一面板管理所有告警
  2. 故障诊断加速:完整的时间线追溯能力
  3. 系统可靠性增强:明确的告警状态管理
  4. 使用体验优化:一致的操作交互方式

这项架构改进体现了ntopng对运维可视化和操作便捷性的持续追求,为复杂网络环境下的故障管理提供了更强大的支持。

登录后查看全文
热门项目推荐

项目优选

收起
docsdocs
OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
160
2.03 K
kernelkernel
deepin linux kernel
C
22
6
pytorchpytorch
Ascend Extension for PyTorch
Python
45
78
ops-mathops-math
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
533
60
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
947
556
ohos_react_nativeohos_react_native
React Native鸿蒙化仓库
C++
198
279
openHiTLSopenHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
996
396
communitycommunity
本项目是CANN开源社区的核心管理仓库,包含社区的治理章程、治理组织、通用操作指引及流程规范等基础信息
381
17
openGauss-serveropenGauss-server
openGauss kernel ~ openGauss is an open source relational database management system
C++
146
191
金融AI编程实战金融AI编程实战
为非计算机科班出身 (例如财经类高校金融学院) 同学量身定制,新手友好,让学生以亲身实践开源开发的方式,学会使用计算机自动化自己的科研/创新工作。案例以量化投资为主线,涉及 Bash、Python、SQL、BI、AI 等全技术栈,培养面向未来的数智化人才 (如数据工程师、数据分析师、数据科学家、数据决策者、量化投资人)。
Python
75
71