Apache Fury v0.10.1版本发布：Java高性能序列化框架的重要更新

2025-06-16 12:50:21作者：管翌锬

Apache Fury是一个高性能的跨语言序列化框架，专注于提供极致的序列化速度和低内存开销。它支持Java、Python等多种语言，特别适合大数据量、低延迟的场景。本次发布的v0.10.1版本是Java实现的一系列重要修复和性能优化。

核心改进与修复

内存安全与边界处理增强

本次版本重点修复了多个内存边界相关的安全问题。开发团队优化了MemoryBuffer类的读取逻辑，解决了readBytesAsInt64在非LITTLE_ENDIAN模式下的错误问题，同时修复了原始类型读取时可能出现的缓冲区越界问题。这些改进显著提升了框架在异常情况下的稳定性。

对于空数据块的处理也得到了加强，修复了读取空块时可能出现的越界异常。这些改进使得Fury在边缘情况下更加健壮，能够更好地处理各种异常输入。

不可变集合处理优化

针对Java集合框架中的不可变集合，本次更新修复了ImmutableCollections$SubList重复注册的问题。同时，对java.util.Date及其子类的可变性处理进行了修正，确保这些时间相关类的序列化行为更加符合预期。

安全机制强化

安全方面，v0.10.1引入了SHA-256校验机制来验证disallowed.txt文件的完整性，防止未经授权的修改。这个安全列表用于限制某些特定类的序列化，是Fury安全体系的重要组成部分。开发团队还特别针对Windows系统优化了disallowed.txt的检查机制，确保跨平台行为一致性。

性能优化亮点

元字符串编码优化

MetaStringEncoder::encodeGeneric方法的计算效率得到了显著提升。这个优化减少了字符串编码时的计算开销，对于包含大量字符串数据的序列化场景将带来明显的性能提升。

线程池与内存拷贝优化

ThreadPoolFury实现进行了重构，通过优化线程池管理逻辑提高了整体性能。同时，开发团队采用System.arraycopy替代原有的字节数组拷贝方式，这个底层优化减少了内存操作开销，特别是在处理大块数据时效果更为明显。

功能增强

新版本支持在构建序列化器时传递跟踪引用元数据，这为复杂对象的序列化提供了更多灵活性。同时修复了包含全空元素的集合在序列化时可能出现的NPE问题，增强了框架对特殊数据结构的处理能力。

总结

Apache Fury v0.10.1版本通过一系列关键修复和性能优化，进一步提升了框架的稳定性、安全性和执行效率。这些改进使得Fury在高性能序列化领域的竞争力得到增强，特别是在大数据处理、分布式系统等对序列化性能要求苛刻的场景下表现更为出色。开发团队对边界条件、异常处理和跨平台兼容性的持续关注，也体现了项目对生产环境可靠性的重视。

fory

A blazingly fast multi-language serialization framework for idiomatic domain objects, schema IDL, and cross-language data exchange.

项目地址：https://gitcode.com/gh_mirrors/fu/fory

登录后查看全文