Screenly Anthias项目中Web UI关机重启功能失效问题分析

2025-06-28 22:12:26作者：裘旻烁

问题现象

在Screenly Anthias数字标牌管理系统中，用户通过Web界面执行关机或重启操作时，发现设备在运行约20分钟后该功能会失效。具体表现为：点击设置菜单中的关机或重启按钮后，系统不再响应相关操作请求。

技术背景

Screenly Anthias是基于Raspberry Pi的数字标牌解决方案，其后台使用Celery作为分布式任务队列系统。Celery默认会根据设备CPU核心数自动设置并发工作进程数，这在多核设备上可能导致任务队列处理异常。

根本原因分析

经过深入排查，发现问题根源在于系统定期执行的get_display_power Celery任务。该任务每5分钟运行一次，随着时间推移会逐渐填满任务队列。由于Celery worker的并发数默认等于设备CPU核心数（例如Raspberry Pi 4为4核，Pi 3为2核），导致：

在4核设备上，约20分钟后任务队列饱和
在2核设备上，约10分钟后就会出现问题

当任务队列饱和后，新的关机/重启命令无法被及时处理，造成功能失效的假象。

解决方案

针对此问题，建议从以下几个方面进行优化：

调整Celery并发设置：在Celery配置中明确设置--concurrency参数，避免使用默认值
优化定期任务：重新设计get_display_power任务的执行频率或处理逻辑
任务优先级管理：为关键操作（如关机/重启）设置更高优先级
队列监控机制：实现任务队列状态监控，在队列接近饱和时发出警告

影响范围

该问题主要影响以下环境配置：

使用多核Raspberry Pi设备（如Pi 4）的用户
长期不间断运行的系统
所有基于Screenly Anthias的部署，包括标准Raspberry Pi OS和Balena OS版本

最佳实践建议

为避免类似问题，建议开发者在设计周期性任务系统时：

合理评估任务执行频率对系统负载的影响
为关键操作保留独立的高优先级任务队列
实现完善的队列监控和告警机制
在生产环境中明确设置所有性能相关参数，避免依赖默认值

通过以上措施，可以显著提升系统稳定性和关键功能的可靠性。

Anthias

The world's most popular open source digital signage project.

项目地址：https://gitcode.com/GitHub_Trending/an/Anthias

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。