Prometheus Alertmanager邮件通知配置问题排查指南

2025-05-31 19:27:59作者：管翌锬

prometheus/alertmanager: Alertmanager是Prometheus生态系统的一部分，它用于处理和路由警报通知。当Prometheus服务器检测到满足预定义条件的告警规则时，Alertmanager负责对这些告警进行去重、抑制以及通过多种方式（如邮件、Slack、PagerDuty等）发送给接收者。

项目地址：https://gitcode.com/GitHub_Trending/al/alertmanager

问题背景

在使用Prometheus-community 22.5版本的Helm chart部署Prometheus Alertmanager时，用户遇到了邮件通知无法正常发送的问题。虽然警报能够在Alertmanager的UI界面中正确显示，但配置的邮件通知却未能成功送达。

配置分析

从用户提供的配置文件中，我们可以观察到几个关键配置项：

SMTP服务器配置：使用了企业内部的SMTP服务器(xx.xxx.net)和25端口
发件人设置：配置了gmail邮箱作为发件人
收件人设置：同样使用gmail邮箱作为收件人
TLS设置：禁用了TLS要求(smtp_require_tls: false)

常见问题点

1. SMTP服务器认证问题

企业内部SMTP服务器通常需要认证，但配置中缺少smtp_auth_username和smtp_auth_password参数。即使服务器允许匿名发送，从外部邮箱(gmail)发信通常也需要认证。

2. 发件人与SMTP服务器不匹配

使用gmail邮箱作为发件人，但SMTP服务器是企业内部的，这种配置可能导致服务器拒绝转发请求。建议使用企业邮箱域匹配的地址作为发件人。

3. TLS配置冲突

虽然设置了smtp_require_tls: false，但现代邮件服务器通常强制要求TLS连接。建议尝试启用TLS并配置正确的证书。

4. 接收者配置位置错误

在示例配置中，receivers部分似乎被错误地放在了global块内，这会导致配置解析失败。

正确配置建议

global:
  resolve_timeout: 4h
  smtp_smarthost: 'mail.example.com:587'
  smtp_from: 'alerts@example.com'
  smtp_auth_username: 'alertuser'
  smtp_auth_password: 'password'
  smtp_require_tls: true

route:
  group_by: ['alertname']
  group_wait: 10s
  group_interval: 5m
  repeat_interval: 120h
  receiver: 'default-receiver'

receivers:
- name: 'default-receiver'
  email_configs:
  - to: 'admin@example.com'
    send_resolved: true
    headers:
      Subject: 'Alert: {{ .CommonLabels.alertname }}'