Syncthing 长时间运行后CPU使用率逐渐升高问题分析

2025-04-29 14:41:31作者：宣海椒Queenly

问题现象

在使用Syncthing文件同步工具时，用户发现一个有趣的现象：随着运行时间的延长，系统的CPU使用率会缓慢但持续地上升。具体表现为：

初始运行时CPU占用率低于1%
运行2天后上升到2%左右
运行数周后可能达到4%以上
重启Syncthing后CPU使用率立即恢复正常水平

这个问题在Linux系统上尤为明显，特别是在执行文件夹扫描操作后更为突出。用户通过反复点击"重新扫描所有文件夹"按钮可以快速复现CPU使用率上升的现象。

问题根源

经过深入分析，开发团队发现问题的根源在于Syncthing的扫描器(walker)实现中存在一个资源泄漏问题。具体来说：

在扫描器代码中创建了一个定时器(ticker)，用于定期处理文件哈希计算
当没有需要哈希的文件时，代码会直接返回，但忘记停止这个定时器
每次扫描操作都会创建新的定时器，但只有部分路径能正确释放
随着时间推移，积累的未释放定时器越来越多，导致CPU需要处理大量定时事件

这个问题是在Syncthing 1.27.3版本中引入的，因为该版本新增了一个提前返回的代码路径，但未正确处理定时器资源释放。

技术细节

在Go语言中，time.Ticker是一种周期性触发事件的机制。每个Ticker都会在后台创建一个goroutine来管理定时事件。如果Ticker没有被正确停止(调用Stop()方法)，这个goroutine会一直存在并继续工作，导致：

系统goroutine数量增加
CPU需要处理更多定时器事件
内存使用量可能也会轻微增加

虽然单个Ticker的影响很小，但在频繁扫描操作下，这些未释放的资源会逐渐积累，最终导致可观测的性能下降。

解决方案

修复方案相对简单直接：在扫描器提前返回的代码路径上添加定时器停止逻辑。具体代码修改是在walker.go文件的walk函数中，在返回前调用ticker.Stop()。

这个修复已经合并到主分支，并将在下一个版本中发布。对于当前受影响的用户，可以考虑以下临时解决方案：

降低全量扫描的频率
设置定时重启Syncthing的机制
降级到不受影响的版本(1.27.2及之前)

经验教训

这个案例给我们几个重要的启示：

资源管理在长时间运行的服务中至关重要，特别是周期性任务
新增代码路径时需要全面考虑资源清理逻辑
性能监控能帮助早期发现问题
社区协作是发现和解决问题的有效途径

对于Go开发者来说，这也提醒我们要特别注意：

time.Ticker必须配合defer或显式Stop使用
避免在循环中创建可能泄漏的资源
对新增的return路径要检查资源释放情况

通过这个问题的分析和解决，Syncthing的稳定性将得到进一步提升，特别是在需要长时间运行的场景下。

syncthing

Open Source Continuous File Synchronization

项目地址：https://gitcode.com/GitHub_Trending/sy/syncthing

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

pytorch

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.21 K

661