首页
/ Grafana Helm Charts中Gateway API健康检查问题解决方案

Grafana Helm Charts中Gateway API健康检查问题解决方案

2025-07-08 07:35:29作者:凌朦慧Richard

问题背景

在使用kube-prometheus-stack部署Grafana并通过Kubernetes Gateway API暴露服务时,用户遇到了"no healthy upstream"错误。这个问题特别出现在使用Azure Application Gateway for Containers作为入口控制器时。虽然其他服务可以正常路由,但Grafana服务却无法正常工作。

问题分析

经过技术讨论和分析,发现问题的根源在于Grafana的健康检查机制。Grafana默认会将请求重定向到/login页面(返回302状态码),而大多数入口控制器期望的健康检查响应是2xx状态码。这种不匹配导致入口控制器认为服务不健康,从而拒绝路由流量。

解决方案

1. 创建自定义健康检查策略

正确的解决方案是为Grafana服务创建专门的健康检查策略,指定正确的健康检查端点。Grafana提供了一个专用的健康检查端点/api/health,这个端点会返回200状态码,非常适合用于健康检查。

apiVersion: alb.networking.azure.io/v1
kind: HealthCheckPolicy
metadata:
  name: grafana-health-check-policy
  namespace: monitoring
spec:
  targetRef:
    group: ""
    kind: Service
    name: centralhub-developer-tools-grafana
  default:
    http:
      path: /api/health
    useTLS: false

2. 关键配置说明

  • path: 必须设置为/api/health,这是Grafana的健康检查端点
  • namespace: 健康检查策略必须与目标服务位于同一命名空间
  • targetRef: 必须正确指向Grafana服务

3. 常见错误配置

  1. 错误的健康检查路径:使用根路径/会导致302重定向
  2. 跨命名空间问题:健康检查策略与服务不在同一命名空间
  3. 端口配置错误:未正确指定服务端口或Pod端口
  4. 不必要的host配置:可能导致健康检查失败

最佳实践建议

  1. 使用与就绪探针相同的路径:通常应用的健康检查端点与Kubernetes就绪探针使用的路径一致
  2. 简化配置:开始时使用最小配置,只指定必要的path参数
  3. 命名空间一致性:确保健康检查策略与目标服务位于同一命名空间
  4. 逐步调试:先验证健康检查端点是否可达,再配置入口控制器

总结

通过正确配置健康检查策略,指定Grafana的健康检查端点/api/health,可以解决"no healthy upstream"问题。这个问题不仅限于Grafana,其他会进行重定向的应用(如Keycloak)也可能遇到类似问题,都可以通过类似方法解决。理解入口控制器健康检查机制与应用程序行为的匹配关系,是解决这类问题的关键。

对于使用Azure Application Gateway for Containers的用户,还需要特别注意健康检查策略的API版本和字段名称与特定入口控制器的要求保持一致。

登录后查看全文
热门项目推荐

项目优选

收起
openHiTLS-examplesopenHiTLS-examples
本仓将为广大高校开发者提供开源实践和创新开发平台,收集和展示openHiTLS示例代码及创新应用,欢迎大家投稿,让全世界看到您的精巧密码实现设计,也让更多人通过您的优秀成果,理解、喜爱上密码技术。
C
53
466
kernelkernel
deepin linux kernel
C
22
5
openHiTLSopenHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
349
381
nop-entropynop-entropy
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
7
0
openGauss-serveropenGauss-server
openGauss kernel ~ openGauss is an open source relational database management system
C++
133
186
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
878
517
Cangjie-ExamplesCangjie-Examples
本仓将收集和展示高质量的仓颉示例代码,欢迎大家投稿,让全世界看到您的妙趣设计,也让更多人通过您的编码理解和喜爱仓颉语言。
Cangjie
336
1.1 K
ohos_react_nativeohos_react_native
React Native鸿蒙化仓库
C++
180
264
cherry-studiocherry-studio
🍒 Cherry Studio 是一款支持多个 LLM 提供商的桌面客户端
TypeScript
612
60
note-gennote-gen
一款跨平台的 Markdown AI 笔记软件,致力于使用 AI 建立记录和写作的桥梁。
TSX
83
4