Kamal部署中健康检查失败的深度分析与解决方案

2025-05-18 21:36:40作者：宣聪麟

问题背景

Kamal作为现代化的部署工具，在版本2中引入了更严格的健康检查机制。许多开发者在升级或新部署时遇到了"target failed to become healthy"错误，导致部署流程中断。本文将深入分析这一问题的根源，并提供全面的解决方案。

健康检查失败通常表现为部署过程中容器无法达到健康状态，最终导致部署终止。从日志中可以看到，Kamal会定期向应用发送/up路径的请求，如果得不到预期的200响应，就会判定为不健康。

在Rails应用中，如果启用了force_ssl，会导致健康检查请求被重定向：

# 错误配置
config.force_ssl = true

解决方案：

# 正确配置
config.force_ssl = false

# 或者针对/up路径豁免SSL重定向
config.ssl_options = { 
  redirect: { exclude: ->(request) { request.path == '/up' } }

Rails的主机授权检查会拦截健康检查请求：

# 解决方案
config.host_authorization = { 
  exclude: ->(request) { request.path == '/up' } }

Kamal 2默认使用80端口，而许多应用仍配置为3000端口：

# deploy.yml正确配置
proxy:
  app_port: 3000  # 明确指定应用端口

HTTP优化器是Kamal推荐的工具，需要正确配置：

# Dockerfile配置
EXPOSE 80  # HTTP优化器默认使用80端口
CMD ["bundle", "exec", "http_optimizer", "./bin/rails", "server"]

Gemfile中需要添加：

gem "http_optimizer", require: false

对于不使用代理的角色(如jobs)，需要自定义健康检查：

servers:
  jobs:
    options:
      health-cmd: bin/jobs-healthy
      readiness_delay: 30s

对于非Rails应用，需要特别注意：

考虑添加简单的PHP健康检查脚本：

<?php 
header("HTTP/1.1 200 OK");
echo "OK";
?>

通过以上分析和解决方案，开发者应该能够有效解决Kamal部署中的健康检查问题，确保应用顺利部署和运行。记住，健康检查是部署流程的重要保障，正确的配置不仅能解决当前问题，还能提高应用的可靠性。

登录后查看全文