首页
/ Uptime-Kuma 1.23.12版本中证书监控指标的缺失问题分析

Uptime-Kuma 1.23.12版本中证书监控指标的缺失问题分析

2025-04-29 04:40:39作者:郁楠烈Hubert

在Uptime-Kuma监控系统的1.23.12版本更新后,用户报告了一个关于HTTPS证书监控指标缺失的问题。具体表现为monitor_cert_days_remainingmonitor_cert_is_valid这两个重要的Prometheus指标不再被导出,尽管在仪表板上仍能看到相关数据。

问题背景

Uptime-Kuma作为一个开源的监控解决方案,提供了对网站HTTPS证书有效期的监控功能。在1.23.11及之前版本中,系统能够正常导出两个关键指标:

  • monitor_cert_days_remaining:显示证书剩余有效天数
  • monitor_cert_is_valid:指示证书是否有效

这些指标对于运维人员监控证书过期情况至关重要,可以用于设置告警以防止证书意外过期导致的网站不可用。

问题原因分析

根据代码审查,这个问题很可能是在1.23.12版本中引入的,与PR #4630的修改有关。具体表现为一个时序问题:

  1. 证书信息的获取和存储逻辑被分离到了不同的代码段
  2. monitor.js文件中,证书信息的更新和指标导出的时序出现了不一致
  3. 指标导出可能在证书信息更新完成前就被触发,导致空值或缺失

技术细节

在Uptime-Kuma的代码结构中,证书监控功能涉及两个关键部分:

  1. 证书检查逻辑:负责实际连接到目标网站并验证证书信息
  2. 指标导出逻辑:将检查结果转换为Prometheus可识别的指标格式

问题的核心在于这两个部分之间的同步机制出现了问题,导致指标导出时无法获取到最新的证书信息。

影响范围

这个问题影响所有使用以下配置的用户:

  • 运行Uptime-Kuma 1.23.12版本
  • 配置了HTTPS类型的监控项
  • 依赖Prometheus指标进行证书监控告警

特别是那些将证书监控指标集成到Grafana仪表板或告警系统的用户,会立即注意到数据的缺失。

临时解决方案

对于急需这些指标的用户,可以考虑以下临时方案:

  1. 回退到1.23.11版本,直到问题修复
  2. 通过Uptime-Kuma的API获取证书信息,自行转换为Prometheus指标
  3. 使用外部证书检查工具作为临时替代方案

长期解决方案

开发团队需要解决的核心问题是确保证书信息的获取和指标导出之间的正确时序。可能的修复方向包括:

  1. 在指标导出前确保证书检查已完成
  2. 实现一个缓存机制,保存最后一次成功的证书检查结果
  3. 添加指标导出的重试逻辑,当证书信息不可用时自动重试

总结

Uptime-Kuma 1.23.12版本中出现的证书监控指标缺失问题,突显了监控系统中时序同步的重要性。对于依赖自动化证书监控的用户,建议密切关注后续的修复版本发布。同时,这也提醒我们在升级监控系统时要充分测试关键功能的可用性,特别是那些用于告警的核心指标。

登录后查看全文
热门项目推荐
相关项目推荐