Dromara/soul项目K8s存活探针wget命令缺失问题分析

2025-05-27 08:12:46作者：鲍丁臣Ursa

项目地址：https://gitcode.com/gh_mirrors/so/soul

问题背景

在Dromara/soul项目的Kubernetes部署环境中，发现了一个关于存活探针(Liveness Probe)的健康检查问题。当Kubernetes对Pod进行健康检查时，系统日志显示存活探针无法正常执行wget命令，导致容器被反复标记为不健康状态。

问题现象

从错误日志中可以清晰地看到，Kubernetes的存活探针尝试执行以下命令时失败：

wget -q -O - http://localhost:8884/actuator/health | grep UP || exit 1

系统报错信息表明：

容器运行时无法找到wget命令
整个命令被当作一个文件路径来查找，而不是作为shell命令执行
由于探针连续失败，Pod被标记为不健康状态

根本原因分析

经过深入分析，这个问题主要由两个因素导致：

基础镜像缺失必要工具：用于部署的容器镜像中没有安装wget工具，而存活探针配置中却依赖wget来进行健康检查。
命令执行方式不当：Kubernetes探针配置中直接将包含管道操作的完整shell命令作为执行命令，而没有通过shell解释器来执行。正确的做法应该是通过/bin/sh -c来执行包含管道等shell特性的命令。

解决方案

针对这个问题，我们提供了两种可行的解决方案：

方案一：修改存活探针配置

将原来的exec探针改为httpGet探针，直接检查健康端点：

livenessProbe:
  httpGet:
    path: /actuator/health
    port: 8884
  initialDelaySeconds: 30
  periodSeconds: 10

方案二：完善容器环境并正确配置命令

如果确实需要使用exec探针，需要：

在Dockerfile中安装wget工具：

RUN apt-get update && apt-get install -y wget

正确配置exec探针，通过shell执行命令：

livenessProbe:
  exec:
    command:
    - /bin/sh
    - -c
    - "wget -q -O - http://localhost:8884/actuator/health | grep UP || exit 1"
  initialDelaySeconds: 30
  periodSeconds: 10

最佳实践建议

优先使用httpGet/tcpSocket探针：在Kubernetes环境中，尽可能使用httpGet或tcpSocket类型的探针，它们比exec探针更可靠且不需要依赖容器内的工具。
保持镜像最小化：如果必须使用exec探针，确保容器镜像中包含所需的工具，同时遵循最小化原则，只安装必要的工具。
合理设置探针参数：根据应用启动时间合理配置initialDelaySeconds，避免应用尚未完全启动就被判定为不健康。
完善的日志记录：为健康检查端点添加适当的日志记录，便于问题排查。

总结

在Kubernetes环境中，存活探针的配置需要特别注意容器环境的完备性和命令执行方式的正确性。通过本文的分析和解决方案，可以帮助开发者避免类似的健康检查问题，确保应用在Kubernetes集群中稳定运行。对于Dromara/soul这样的开源项目，合理的健康检查机制更是保证其高可用性的重要组成部分。

shenyu

项目地址：https://gitcode.com/gh_mirrors/so/soul

登录后查看全文