Plausible社区版ClickHouse健康检查问题分析与解决方案

2025-07-07 15:35:25作者：俞予舒Fleming

问题背景

在Plausible社区版2.1.2版本的Docker Compose部署过程中，用户发现plausible_events_db(ClickHouse)容器频繁出现健康检查失败的情况。该问题表现为容器启动后健康检查无法通过，导致依赖该服务的其他容器无法正常启动。

通过深入排查，发现问题的根源在于ClickHouse容器的健康检查配置。原配置中使用的是localhost作为健康检查的目标地址：

healthcheck:
  test: ["CMD-SHELL", "wget --no-verbose --tries=1 --spider http://localhost:8123/ping || exit 1"]

在Docker容器环境中，localhost的解析可能存在问题。这是因为：

经过验证，将健康检查地址从localhost改为127.0.0.1即可解决问题：

healthcheck:
  test: ["CMD-SHELL", "wget --no-verbose --tries=1 --spider http://127.0.0.1:8123/ping || exit 1"]

这个修改确保了健康检查总是能正确访问到容器内部的ClickHouse服务，无需额外暴露8123端口。

在升级过程中还发现另一个相关问题：2.1.2版本的compose文件使用了Docker v25特有的healthcheck.start_interval参数。对于使用较旧Docker版本的用户，这会导致部署失败。

建议解决方案：

这个案例展示了容器网络中DNS解析的微妙差异，以及版本兼容性在容器编排中的重要性。通过简单的地址修改和版本适配，可以确保Plausible社区版的ClickHouse服务稳定运行。这也提醒开发者在编写健康检查时需要考虑容器环境的特殊性。

登录后查看全文