Apache Fury 线程安全模式下的CPU利用率问题分析与修复

2025-06-25 09:54:04作者：卓炯娓

项目地址：https://gitcode.com/gh_mirrors/in/fory

Apache Fury是一个高性能的Java序列化框架，在其0.7.0版本中，当使用ThreadSafeFury模式进行序列化操作时，可能会出现CPU利用率飙升至100%的问题。本文将深入分析该问题的成因以及解决方案。

问题现象

在Spring Boot 3.3+环境中使用Dragonwell17 JDK时，当应用程序通过Fury进行频繁的序列化和反序列化操作时，系统监控显示CPU利用率突然升高至100%，并且持续不降。通过线程转储分析，发现大量线程阻塞在WeakHashMap.put()方法的调用上。

根本原因

问题根源在于ThreadLocalFury实现中的线程安全性缺陷。ThreadLocalFury内部使用WeakHashMap来跟踪所有创建的Fury实例，但这个数据结构在多线程环境下存在并发问题。具体表现为：

每个线程首次访问ThreadLocalFury时，都会通过ThreadLocal机制创建一个新的Fury实例
这些新创建的实例会被放入一个共享的WeakHashMap中
当多个线程同时初始化时，它们会并发地向WeakHashMap执行put操作
WeakHashMap不是线程安全的，导致内部状态不一致，最终引发CPU利用率飙升

解决方案

Apache Fury项目维护者已经通过以下方式修复了这个问题：

使用Collections.synchronizedMap()包装WeakHashMap，确保对映射的所有访问都是线程安全的
或者也可以考虑使用ConcurrentHashMap替代WeakHashMap

对于用户而言，正确的使用方式应该是：

确保ThreadSafeFury实例是静态的（static final），避免重复创建
在Spring等框架中，应该将Fury实例配置为单例Bean

最佳实践

为了避免类似问题，在使用Apache Fury时建议：

对于高并发应用，优先考虑使用ThreadPoolFury而非ThreadLocalFury
确保Fury实例的创建是可控的，避免无限制的实例化
在生产环境部署前，进行充分的压力测试
及时更新到修复了该问题的Fury版本

该问题的修复体现了开源社区对性能问题的快速响应能力，也提醒我们在使用高性能序列化框架时需要注意其线程模型和资源管理机制。

fory

项目地址：https://gitcode.com/gh_mirrors/in/fory

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

leetcode

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.37 K

781