Apache Fury 反序列化 InputStream 问题解析与优化方案

2025-06-25 14:44:40作者：邵娇湘

Apache Fury 是一个高性能的序列化框架，但在处理 InputStream 反序列化时存在一些限制。本文将深入分析问题原因，并提供解决方案。

问题现象

当尝试从 InputStream 反序列化对象时，Fury 会抛出异常。具体表现为：

使用 ByteArrayInputStream 时抛出 UnsupportedOperationException
使用其他 InputStream 实现时抛出 IllegalArgumentException

根本原因

Fury 的序列化/反序列化机制存在两种模式：

直接序列化到字节数组（serializeJavaObject(object)）
序列化到输出流（serializeJavaObject(outputstream, object)）

关键区别在于输出流模式会在序列化数据前写入数据长度前缀，而字节数组模式不会。当尝试用反序列化输入流的方法读取直接序列化的字节数组时，就会出现问题。

当前解决方案

目前有两种临时解决方案：

手动为字节数组添加长度前缀
确保序列化和反序列化使用匹配的方法（都用流模式或都用字节数组模式）

架构优化方向

从技术角度看，Fury 可以进一步优化以原生支持流式反序列化：

内存缓冲区设计：

当前 MemoryBuffer 是 final 类，限制了扩展性
可考虑多实现方案（基于字节数组、InputStream、Channel等）

流式读取优化：

实现基于 InputStream 的渐进式读取
支持 Channel 实现零拷贝

性能权衡：

小对象保持现有高效模式
大对象启用流式处理降低延迟

未来展望

随着大数据和AI应用的发展，大对象处理需求日益增长。Fury 的流式反序列化能力将变得尤为重要。社区正在考虑以下改进：

原生支持 InputStream 和 Channel
优化大对象处理性能
提供更灵活的缓冲区实现

这些改进将使 Fury 在保持高性能的同时，更好地适应各种使用场景。

登录后查看全文

项目优选

收起

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

flutter_flutter

Oohos_react_native

React Native鸿蒙化仓库

昇腾LLM分布式训练框架

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统