HertzBeat监控配置批量导入性能优化实践

2025-06-03 00:25:32作者：钟日瑜

问题背景

在HertzBeat监控系统中，用户反馈在导入500条监控配置时耗时长达8分钟，且导入过程中无法看到数据实时更新的情况，导致用户体验较差。经过分析发现，这是由于系统在MonitorServiceImpl类中使用了类级别的@Transactional注解，导致所有配置导入被包裹在一个大事务中执行。

技术分析

事务处理机制分析

当前实现中，监控配置的导入操作被设计为一个原子性事务。这种设计存在两个主要问题：

长事务问题：当导入大量配置时，数据库事务会持续很长时间，可能导致锁等待和连接池耗尽
用户体验问题：用户无法感知导入进度，容易误认为系统卡死

检测机制分析

系统在导入每个监控配置前会执行detectMonitor操作，用于获取监控的实时可用状态。这一设计虽然保证了数据展示的准确性，但也带来了额外的性能开销。

解决方案设计

后端实现方案

采用SSE(Server-Sent Events)技术实现进度实时推送：

public void importConfig(String fileName, InputStream is) {
    //...
    try {
        for (int i = 0; i < totalSize; i++) {
            monitorService.validate(formList.get(i), false);
            monitorService.addMonitor(formList.get(i).getMonitor(), formList.get(i).getParams(),
                    formList.get(i).getCollector(), monitorDto.getGrafanaDashboard());
            // 计算当前进度
            int currentPercent = (i + 1) * 100 / totalSize;
            int completed = i + 1; // 已完成项数
            // 在定义的进度阈值或最后一项时发布事件
            if (currentPercent >= nextPercent || i == totalSize - 1) {
                emitter.send(SseEmitter.event()
                            .id(String.valueOf(System.currentTimeMillis()))
                            .name("IMPORT_TASK_EVENT")
                            .data(new ImportTaskProcess(fileName, currentPercent, totalSize, completed)));
                nextPercent += progressStep;
            }
        }
        //...发送成功通知
    } catch (Exception e) {
          //...发送失败通知
        ));
    }
}