JetLinks社区项目系统假死问题分析与解决方案

2025-06-05 14:28:03作者：宣利权Counsellor

JetLinks 基于Java8,Spring Boot 2.x ,WebFlux,Netty,Vert.x,Reactor等开发, 是一个全响应式的企业级物联网平台。支持统一物模型管理,多种设备,多种厂家,统一管理。统一设备连接管理,多协议适配(TCP,MQTT,UDP,CoAP,HTTP等),屏蔽网络编程复杂性,灵活接入不同厂家不同协议等设备。实时数据处理,设备告警,消息通知,数据转发。地理位置,数据可视化等。能帮助你快速建立物联网相关业务系统。

项目地址：https://gitcode.com/gh_mirrors/je/jetlinks-community

问题背景

在JetLinks社区项目2.0.0版本中，系统出现了假死现象，主要表现为登录接口超时，同时数据库出现大量死锁。经过深入分析，发现这是一个典型的高并发场景下的系统性能问题。

问题现象

系统主要表现出以下异常现象：

登录接口响应超时
数据库出现大量死锁
部分接口(如version接口)能正常响应，而其他接口(如菜单树接口)则超时
查询ES中的设备日志接口在假死状态下仍能正常工作

根本原因分析

通过线程堆栈分析和数据库监控，我们定位到问题的核心原因：

高频数据写入导致数据库连接池耗尽：系统中有大量设备持续上报数据，触发对设备主表的频繁更新操作，这些操作都是通过事务执行的。
事务并发冲突：多个事务同时尝试修改相同设备记录，导致数据库死锁频发。
资源竞争：数据库连接池被耗尽后，系统无法处理新的请求，表现为接口超时。
Reactor框架潜在问题：虽然线程堆栈未显示明显阻塞，但Reactor框架版本(2020.0.22)可能存在某些已知问题。

解决方案

针对上述问题，我们提出并实施了以下解决方案：

1. 优化数据写入策略

对于高频数据写入场景，建议采用缓冲批量写入策略：

// 示例代码：使用buffer处理高频写入
Flux<Data> dataFlux = ...; // 数据源
dataFlux
    .bufferTimeout(100, Duration.ofMillis(500)) // 每500ms或100条数据批量处理
    .flatMap(batch -> repository.saveAll(batch), 32) // 控制并发度
    .subscribe();

这种批量处理方式可以显著减少数据库操作次数，降低锁竞争。

2. 事务优化

对于非关键数据更新，可以考虑以下优化：

使用@Transactional(propagation = Propagation.NOT_SUPPORTED)注解标记非事务方法
对于必须事务的操作，缩短事务持有时间
避免在事务中执行耗时操作

3. 框架升级

将Reactor框架版本从2020.0.22升级到最新稳定版，修复潜在问题。

4. 错误处理增强

添加全局错误处理逻辑，防止Flux因未捕获的异常被挂起：

Hooks.onOperatorError((throwable, obj) -> {
    log.error("Operator error", throwable);
    return new RuntimeException(throwable);
});

实施效果

实施上述优化后，系统稳定性得到显著提升：

数据库死锁数量大幅减少
系统在高负载下仍能保持响应
关键接口响应时间趋于稳定

经验总结

通过这次问题排查，我们总结了以下经验：

高频数据写入场景必须考虑批量处理
数据库事务使用要谨慎，避免长时间持有
框架版本要保持更新，及时修复已知问题
系统监控要完善，包括线程状态、数据库连接池使用情况等

对于类似物联网平台项目，数据写入频率高是常态，开发时应提前考虑这些性能因素，采用合适的设计模式和技术方案。

jetlinks-community

项目地址：https://gitcode.com/gh_mirrors/je/jetlinks-community

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

leetcode

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

208

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理

apinto

基于golang开发的网关。具有各种插件，可以自行扩展，即插即用。此外，它可以快速帮助企业管理API服务，提高API服务的稳定性和安全性。