Apache Fury 序列化自定义类型时遇到的 NullPointerException 问题分析

2025-06-25 05:23:55作者：卓艾滢Kingsley

Apache Fury 是一个高性能的序列化框架，但在处理某些自定义类型时可能会遇到 NullPointerException 异常。本文将深入分析这个问题的成因、解决方案以及相关的技术背景。

问题现象

在使用 Apache Fury 0.5.0 版本序列化一个包含泛型和继承关系的自定义类时，开发者遇到了两种不同的错误表现：

当启用代码生成(codeGen=true)时，抛出 NullPointerException
当禁用代码生成(codeGen=false)时，序列化能够正常工作

错误堆栈显示问题出现在类型解析阶段，特别是在处理泛型类型参数时。

问题复现

通过简化后的测试代码可以复现这个问题：

class MyInternalClass<T> {
    public int c = 9;
}

class MyInternalBaseClass extends MyInternalClass<String> {
    public int d = 19;
}

class MyClass {
    protected Map<String, MyInternalClass<?>> fields;
    private transient int r = 13;

    public MyClass() {
        fields = new TreeMap<>(String.CASE_INSENSITIVE_ORDER);
        fields.put("test", new MyInternalBaseClass());
    }
}

技术分析

根本原因

这个问题主要与 Fury 的类型系统处理有关，特别是在以下方面：

泛型类型捕获：当处理 MyInternalClass<?> 这样的通配符泛型时，Fury 需要捕获实际的类型参数
类型变量解析：在解析继承链中的泛型类型时，类型变量的绑定可能出现问题
代码生成路径：代码生成路径与非代码生成路径的类型处理逻辑存在差异

具体问题点

在 TypeRef$WildcardCapturer 类中，当尝试捕获通配符类型参数时，对类型变量的处理不够健壮，导致在某些情况下出现空指针异常。这个问题在 PR #1553 引入的类型系统改进后变得更加明显。

解决方案

目前有以下几种解决方案：

临时解决方案：在构建 Fury 实例时禁用代码生成

Fury fury = Fury.builder().withLanguage(Language.JAVA)
    .withCodegen(false)
    .build();

等待官方修复：开发团队已经确认这是一个 bug，并计划在后续版本中修复
类型注册优化：确保所有相关的泛型类型都被正确注册

技术扩展

关于 transient 字段

Fury 会像 Java 原生序列化一样自动忽略 transient 字段，这与问题无关，但值得注意。如果需要显式控制字段的序列化行为，可以使用 @Ignore 注解。

性能考量

虽然禁用代码生成可以解决这个问题，但需要注意：

代码生成路径通常比反射路径快 2-5 倍
对于性能敏感的场景，建议在问题修复后重新启用代码生成

最佳实践

在处理复杂类型序列化时，建议：

逐步构建类型层次，确保每一层都能正确序列化
对于泛型类型，考虑使用明确的类型参数而非通配符
在遇到问题时，尝试简化类型结构以隔离问题
关注 Fury 项目的更新，及时获取问题修复

总结

Apache Fury 在处理复杂泛型类型时出现的 NullPointerException 问题，反映了类型系统在极端情况下的不足。通过理解问题的本质和现有的解决方案，开发者可以更好地在项目中使用这个高性能的序列化框架。随着项目的持续发展，这类问题有望得到根本性解决。

fory

A blazingly fast multi-language serialization framework for idiomatic domain objects, schema IDL, and cross-language data exchange.

项目地址：https://gitcode.com/gh_mirrors/fu/fory

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。