Apache Fury 线程池序列化中的NullPointerException问题分析与解决

2025-06-25 23:16:23作者：仰钰奇

问题背景

Apache Fury作为一个高性能的序列化框架，在Java生态系统中被广泛应用。近期有用户在使用Fury 0.6.0版本时遇到了NullPointerException问题，特别是在高并发环境下进行序列化和反序列化操作时。这个问题主要出现在使用ThreadPoolFury进行多线程处理时，导致系统稳定性受到影响。

问题现象

用户在使用Scala 2.13.12和JDK 17的环境中，配置了Fury的线程安全池，并在高并发场景下（约20,000次/秒的调用频率）遇到了两类异常：

序列化时的NullPointerException，仅显示"null"信息，缺乏详细堆栈
反序列化时的NullPointerException，提示"String.length()"因为"msg"为null而无法调用

问题分析

经过深入分析，发现问题主要出在FuryPooledObjectFactory的实现中。具体来说：

反序列化问题：当线程上下文类加载器(Thread Context ClassLoader)为null时，FuryPooledObjectFactory中的classLoaderLocal.get()会返回null，导致后续的缓存查询操作抛出NullPointerException。
日志记录问题：原始版本中当错误信息为null时，日志记录会直接抛出异常，而不是优雅地处理这种情况。
线程安全性问题：在多线程环境下，特别是应用启动阶段，线程上下文类加载器可能尚未正确设置，导致临时性的null值问题。

解决方案

Apache Fury团队已经针对这些问题进行了修复：

空值保护：在获取线程上下文类加载器时增加了空值检查，确保即使ClassLoader为null也能优雅处理。
日志健壮性：改进了日志记录逻辑，避免因null消息导致的二次异常。
缓存处理：优化了类加载器缓存的获取逻辑，确保在边缘情况下也能保持稳定。

验证与升级建议

用户可以通过以下方式验证和解决该问题：

升级到最新快照版本(0.8.0-SNAPSHOT)，该版本已包含完整修复
在应用启动阶段增加适当的类加载器检查
对于关键业务路径，考虑添加重试机制处理临时性异常

技术启示

这个问题给我们几个重要的技术启示：

线程局部变量的安全性：使用ThreadLocal时需要考虑所有可能的取值情况，包括null值。
高并发下的边缘情况：在高QPS系统中，即使是极低概率的边缘情况也会被放大，需要全面考虑。
日志系统的健壮性：日志记录本身不应该成为系统不稳定的因素，需要确保日志代码的可靠性。
类加载器生命周期：在动态环境中，类加载器的生命周期管理需要特别关注。

通过这次问题的分析和解决，Apache Fury在稳定性和健壮性方面又向前迈进了一步，为高并发场景下的序列化需求提供了更可靠的保障。

登录后查看全文

项目优选

收起

deepin linux kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

昇腾LLM分布式训练框架

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

Oohos_react_native

React Native鸿蒙化仓库