Apache Fury 中 Java 动态代理自引用问题的分析与解决

2025-06-25 15:52:40作者：管翌锬

项目地址：https://gitcode.com/gh_mirrors/in/incubator-fury

问题背景

在 Java 序列化框架 Apache Fury 的使用过程中，发现了一个关于动态代理（Proxy）对象自引用的特殊问题。当动态代理的 InvocationHandler 持有对代理对象本身的引用时，经过 Fury 序列化和反序列化后，这个自引用会丢失变为 null。

问题复现

考虑以下典型场景：

public class ProxySelfReferenceTest {
    public static class MyInvocationHandler implements InvocationHandler, Serializable {
        private Callable<String> myProxy; // 持有对代理对象的引用
        
        @Override
        public Object invoke(Object proxy, Method method, Object[] args) {
            return "Result from proxy";
        }
        
        // getter/setter 省略
    }

    public static void main(String[] args) {
        MyInvocationHandler handler = new MyInvocationHandler();
        Callable<String> proxy = (Callable<String>) Proxy.newProxyInstance(...);
        handler.setMyProxy(proxy); // 设置自引用
        
        // 序列化/反序列化后
        Callable<String> deserialized = fury.deserialize(fury.serialize(proxy));
        MyInvocationHandler deserializedHandler = 
            (MyInvocationHandler) Proxy.getInvocationHandler(deserialized);
        
        // 这里 deserializedHandler.getMyProxy() 将为 null
    }
}

技术分析

这个问题的根源在于 Java 动态代理的特殊创建机制和 Fury 的序列化策略：

代理对象创建顺序：在反序列化时，Fury 需要先创建 InvocationHandler 实例，然后才能创建代理对象。但此时 handler 中引用的代理对象还不存在。
循环引用处理：通常 Fury 会通过引用跟踪（ref tracking）来处理对象间的循环引用，但对于这种"自引用"的特殊情况，标准机制无法直接适用。
代理对象特性：Java 的动态代理对象是通过 Proxy.newProxyInstance 动态生成的，无法像普通对象那样预先创建并设置引用。

解决方案

Fury 通过以下方式解决了这个问题：

延迟引用设置：在反序列化过程中，先创建 InvocationHandler 但不立即设置其引用的代理对象。
代理对象标记：在创建代理对象后，通过特殊标记识别需要处理自引用的 handler。
后置处理：在所有对象都创建完成后，再遍历并设置这些自引用关系。

核心修复代码逻辑如下：

// 伪代码展示核心思路
Object readProxy() {
    // 1. 先读取 handler
    InvocationHandler handler = readHandler(); 
    
    // 2. 创建代理对象
    Object proxy = createProxy(handler);
    
    // 3. 如果 handler 需要设置自引用
    if (handler instanceof SelfReferencingHandler) {
        ((SelfReferencingHandler)handler).setProxy(proxy);
    }
    
    return proxy;
}