Apache Fury 在 Zing JDK 上的静态字段访问问题分析

2025-06-25 00:58:54作者：柯茵沙

Apache Fury 是一个高性能的序列化框架，但在某些特定环境下会出现稳定性问题。本文将详细分析 Fury 在 Azul Zing JDK 上运行时出现的段错误问题及其根本原因。

问题现象

用户在使用 Apache Fury 0.4.1 版本配合 Azul Zing JDK8（版本 zing21.08.1.0-1-jdk8.0.302-linux_x64）时，在 CentOS 7.9 系统上遇到了段错误（Segmentation fault）。错误发生在初始化 Fury 实例的过程中，具体是在尝试访问 MethodHandles.Lookup 类的 IMPL_LOOKUP 静态字段时。

从错误日志可以看到，JVM 在尝试执行对象重定位操作时崩溃，调用栈显示问题源于 Fury 内部对 Unsafe API 的使用方式。

根本原因分析

经过深入调查，发现问题出在 Fury 框架对 sun.misc.Unsafe API 的不正确使用上。具体来说，Fury 在获取静态字段时没有遵循 Unsafe API 的正确调用规范。

问题代码位于 _Lookup.java 文件中，原始实现如下：

try {
    Field implLookup = Lookup.class.getDeclaredField("IMPL_LOOKUP");
    long fieldOffset = _JDKAccess.UNSAFE.staticFieldOffset(implLookup);
    trustedLookup = (Lookup) _JDKAccess.UNSAFE.getObject(Lookup.class, fieldOffset);
} catch (Throwable ignored) {
    // ignored
}

这段代码的问题在于直接使用 Class 对象作为 getObject 方法的第一个参数。根据 Unsafe API 的规范，应该先获取静态字段的基地址（base），然后再结合偏移量来访问字段值。

正确的实现方式

正确的实现应该使用 staticFieldBase 方法先获取字段的基地址，然后再进行访问：

try {
    Field implLookup = Lookup.class.getDeclaredField("IMPL_LOOKUP");
    long fieldOffset = _JDKAccess.UNSAFE.staticFieldOffset(implLookup);
    Object fieldBase = _JDKAccess.UNSAFE.staticFieldBase(implLookup);
    trustedLookup = (Lookup) _JDKAccess.UNSAFE.getObject(fieldBase, fieldOffset);
} catch (Throwable ignored) {
    // ignored
}

为什么在部分环境下能工作

这个错误在 OpenJDK 和较新版本的 Zing JDK（23.08.300.0-2 及以上）中不会导致崩溃，因为这些环境默认启用了 UseTrueObjectsForUnsafe JVM 选项。当该选项启用时，staticFieldBase 方法会返回 Class 对象本身，使得原始代码看似能正常工作。

然而，这种行为并不是规范保证的，属于实现细节层面的巧合。在旧版 Zing JDK 中，由于 UseTrueObjectsForUnsafe 默认关闭，Unsafe API 期望接收的是原始的 klassOop 而非 java.lang.Class 实例，因此导致了段错误。