Apache Fury Scala 对象反序列化问题解析

2025-06-25 19:58:04作者：董灵辛Dennis

问题背景

在使用 Apache Fury 进行 Scala 对象序列化/反序列化时，开发人员发现了一个特殊现象：当尝试反序列化一个 Scala 的 case object 或单例对象时，首次反序列化会返回 null 值，而只有在执行过一次序列化操作后，后续的反序列化才能正常工作。

问题复现

这个问题在以下两种场景中表现明显：

简单 case class 场景：定义一个简单的 case class 并尝试反序列化其序列化后的字节数组，首次反序列化返回 null，执行一次序列化操作后，再次反序列化才能得到正确结果。
Scala 枚举模式场景：使用 sealed trait 和 case object 实现的枚举模式，当修改枚举值后重新运行程序，反序列化会返回 null 而不是预期的枚举值。

技术分析

经过深入分析，发现问题的根源在于 Scala 对单例对象（object）的懒加载机制。Scala 中的单例对象是延迟初始化的，只有在首次被访问时才会真正创建实例。这种设计导致了以下行为：

当 Fury 的 SingletonObjectSerializer 尝试读取单例对象时，如果该对象尚未被初始化，其 MODULE$ 字段可能为 null 或者根本不存在。
只有在程序显式引用了该单例对象（如执行序列化操作时），Scala 运行时才会初始化该对象，设置 MODULE$ 字段。
这就是为什么首次反序列化失败，而执行序列化后反序列化却能成功的原因——序列化操作隐式触发了单例对象的初始化。

解决方案

针对这个问题，社区提出了一个优雅的解决方案：在 SingletonObjectSerializer 的构造函数中，主动检查并确保目标类已完成初始化。具体实现是通过 Java 的 Unsafe API 来强制初始化目标类：

public SingletonObjectSerializer(Fury fury, Class type) {
  super(fury, type);
  if (Platform.UNSAFE.shouldBeInitialized(type)) {
    Platform.UNSAFE.ensureClassInitialized(type);
  }
  try {
    field = type.getDeclaredField("MODULE$");
  } catch (NoSuchFieldException e) {
    throw new RuntimeException(type + " doesn't have `MODULE$` field", e);
  }
}