Apache Fury序列化框架中的异步编译访问权限问题分析

2025-06-25 04:03:09作者：秋泉律Samson

问题背景

Apache Fury是一个高性能的Java序列化框架，它通过即时编译(JIT)技术生成针对特定类的序列化代码来提升性能。在0.8.0版本中，当启用异步编译(async compilation)功能时，框架在处理某些内部类的序列化时会抛出IllegalAccessError异常。

问题现象

当尝试序列化一个静态内部类DelegatedPage时，如果启用了异步编译功能，框架会在后台编译线程中抛出访问权限异常。具体表现为：

java.lang.IllegalAccessError: failed to access class org.wicketstuff.datastores.common.SessionQuotaManagingDataStore$DelegatedPage from class org.wicketstuff.datastores.common.SessionQuotaManagingDataStore_SizeLimitedDataFuryRefCodec_0

技术分析

根本原因

这个问题的本质在于Java的类加载机制和访问控制机制：

类加载器隔离：Fury在异步编译模式下会使用自定义的ByteArrayClassLoader来加载生成的序列化器类，而原始类是由应用类加载器加载的，这导致了类加载器隔离。
访问权限限制：Java对内部类的访问有严格限制，特别是当访问发生在不同类加载器加载的类之间时。虽然DelegatedPage是public的静态内部类，但在跨类加载器访问时仍然会受到限制。
异步执行上下文：在同步模式下，所有操作都在同一个线程和类加载上下文中执行，因此不会出现访问问题。但在异步模式下，编译和生成代码的操作在后台线程中执行，导致了上下文切换。

影响范围

这个问题不会导致序列化失败，因为Fury有回退机制，当JIT编译失败时会使用反射方式继续工作。但会影响性能，因为无法利用JIT优化带来的性能提升。

解决方案

Apache Fury团队通过以下方式解决了这个问题：

提前解析类信息：在生成序列化代码之前，先解析目标类的所有字段和方法信息，确保在异步编译时能够正确访问。
访问权限检查：在代码生成阶段增加访问权限验证，确保生成的代码能够合法访问目标类的成员。
上下文保持：在异步编译时保持必要的类加载上下文，确保生成的代码能够正确访问原始类。

技术启示

这个问题给我们的启示是：

在使用类生成技术时，必须特别注意访问权限问题，特别是在多类加载器环境下。
异步操作虽然能提高性能，但会引入额外的复杂性，需要仔细处理执行上下文。
对于框架设计者来说，需要为各种边界情况提供优雅的回退机制，就像Fury在JIT失败时自动回退到反射模式一样。

总结

Apache Fury通过修复异步编译模式下的类访问权限问题，进一步提升了框架的稳定性和可靠性。这个案例展示了高性能序列化框架在面对复杂类加载场景时的挑战，以及如何通过技术创新来解决这些问题。对于使用者来说，升级到修复后的版本即可避免此类问题，同时享受到异步编译带来的性能优势。

登录后查看全文

项目优选

收起

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

deepin linux kernel

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

flutter_flutter

昇腾LLM分布式训练框架

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统