Apache Fury性能优化：提升Fury实例创建速度

2025-06-25 23:05:55作者：侯霆垣

A blazingly fast multi-language serialization framework for idiomatic domain objects, schema IDL, and cross-language data exchange.

项目地址：https://gitcode.com/gh_mirrors/fu/fory

Apache Fury作为一个高性能的Java序列化框架，其核心优势在于极致的性能表现。然而在实际使用中发现，Fury实例的创建过程存在性能瓶颈，每次创建耗时约2毫秒，这对于需要频繁创建Fury实例的场景来说是不可忽视的开销。本文将深入分析这一性能问题及其优化方案。

性能瓶颈分析

通过性能剖析工具可以发现，Fury实例创建过程中的主要耗时集中在ClassResolver组件。具体表现为：

字符串格式化开销：在类注册过程中大量使用String.format方法生成错误信息，这在性能敏感路径上造成了不必要的开销。
哈希表扩容成本：内部使用的HashMap在初始化时未预设合理大小，导致频繁扩容操作。
日志记录成本：构造函数中的INFO级别日志记录，特别是获取行号的操作消耗了大量时间。

优化方案

针对上述问题，我们提出以下优化策略：

避免字符串生成：在性能关键路径上，使用Preconditions的模板功能替代直接字符串拼接，减少临时字符串对象的创建。
优化哈希表初始化：根据典型使用场景预估所需容量，直接创建足够大的HashMap，避免动态扩容带来的性能损耗。
日志级别调整：将构造函数中的INFO日志调整为DEBUG级别，减少生产环境中的日志开销。同时研究日志框架内部实现，寻找可能的线程安全缓存机制来优化行号获取性能。
条件判断优化：在类注册校验逻辑中，优先使用简单的if判断而非Preconditions.checkArgument，减少不必要的哈希表查找操作。

实现建议

在实际编码实现时，建议采用以下最佳实践：

对于类注册时的名称冲突检查，可以先进行简单的if判断，确认存在冲突后再构造详细的错误信息。
根据项目典型使用场景统计，预设ClassResolver内部Map的初始容量，一般可设置为128或256，以平衡内存使用和性能。
对于日志系统，考虑实现一个轻量级的日志门面，在性能敏感路径上提供更高效的日志记录能力。

性能预期

经过上述优化后，预期Fury实例的创建时间可以从2毫秒降低到亚毫秒级别，提升幅度可达50%以上。这将显著改善需要频繁创建Fury实例的应用场景性能表现。

使用建议

虽然我们优化了Fury的创建性能，但仍建议用户遵循最佳实践：

尽可能复用Fury实例，避免频繁创建销毁。
对于多线程环境，考虑使用ThreadLocal缓存Fury实例。
在性能关键路径上，禁用不必要的日志输出。

通过这些优化措施，Apache Fury将能够为Java高性能序列化场景提供更加卓越的性能表现。

A blazingly fast multi-language serialization framework for idiomatic domain objects, schema IDL, and cross-language data exchange.

项目地址：https://gitcode.com/gh_mirrors/fu/fory

登录后查看全文

项目优选

收起

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

deepin linux kernel

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

flutter_flutter

昇腾LLM分布式训练框架

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统