Dokku应用停止后仍在运行的故障排查与解决方案

2025-05-05 16:17:14作者：鲍丁臣Ursa

A docker-powered PaaS that helps you build and manage the lifecycle of applications

项目地址：https://gitcode.com/GitHub_Trending/do/dokku

问题现象

在使用Dokku部署应用时，用户发现执行dokku ps:stop命令后，应用虽然显示为已停止状态，但实际上仍在运行并处理请求。通过系统监控工具(如htop)可以观察到应用进程仍在活动状态。

技术背景

Dokku是一个轻量级的PaaS平台，使用Docker容器来部署和管理应用。正常情况下，当执行dokku ps:stop命令时，Dokku应该停止所有与应用相关的Docker容器。然而在某些情况下，可能会出现容器"脱离"Dokku管理的情况。

问题原因分析

容器状态不一致：Docker容器可能由于某些原因(如异常重启、资源限制等)与Dokku的管理系统失去同步。
重启策略冲突：应用配置了on-failure:10的重启策略，可能导致容器在异常退出后自动重启。
多实例冲突：可能存在多个相同应用的容器实例，Dokku只管理了其中一部分。
Docker版本兼容性：使用较新版本的Docker(26.1.0)可能与Dokku的某些管理功能存在兼容性问题。

解决方案

手动停止容器：
- 使用docker ps命令查找所有运行中的容器
- 对与应用相关的容器执行docker stop <CONTAINER_ID>
检查并清理孤立容器：
- 使用docker ps -a查看所有容器状态
- 清理已停止但未删除的容器：docker container prune
调整重启策略：
- 修改应用的Dokku配置，将重启策略改为no：
```
dokku ps:set-restart-policy <app-name> no
```
验证Dokku状态：
- 使用dokku ps:report <app-name>确认应用状态
- 使用dokku logs <app-name>检查应用日志

预防措施

定期维护：定期检查并清理系统中不再需要的容器和镜像。
监控设置：配置监控系统，及时发现并处理"僵尸"容器。
版本管理：保持Dokku和Docker版本在官方推荐的兼容范围内。
部署规范：建立标准化的部署和下线流程，避免操作遗漏。

技术细节

当Dokku管理容器时，会在容器上设置特定的标签和元数据。如果这些元数据丢失或损坏，容器可能会脱离Dokku的管理范围。在这种情况下，需要手动介入处理。

对于生产环境，建议建立自动化监控机制，定期检查容器状态与Dokku记录的一致性，确保所有资源都处于受控状态。

A docker-powered PaaS that helps you build and manage the lifecycle of applications

项目地址：https://gitcode.com/GitHub_Trending/do/dokku

登录后查看全文

项目优选

收起

deepin linux kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

昇腾LLM分布式训练框架

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。