Fury项目中的Map深度拷贝性能优化实践

2025-06-25 08:55:22作者：胡唯隽

A blazingly fast multi-language serialization framework for idiomatic domain objects, schema IDL, and cross-language data exchange.

项目地址：https://gitcode.com/gh_mirrors/fu/fory

背景与问题分析

在Java序列化框架Fury中，Map结构的深度拷贝是一个常见但性能敏感的操作。传统实现中，每次拷贝Map键值对时都需要通过反射获取类型信息（ClassInfo），这在处理大型Map或嵌套结构时会产生显著性能开销。特别是在键值类型高度一致的情况下，重复的类型信息获取操作造成了不必要的性能损耗。

优化方案设计

Fury团队提出了一种基于类型信息缓存的优化策略，核心思路是：

类型信息预取：在Map拷贝前预先获取键值类型的ClassInfo对象
缓存复用：通过线程局部缓存避免重复的类型信息查询
直接传递类ID：在拷贝方法中直接使用缓存的类ID而非重新解析

优化后的关键代码逻辑如下：

protected <K, V> void copyEntry(Map<K, V> originMap, Map<K, V> newMap) {
    ClassResolver classResolver = fury.getClassResolver();
    for (Map.Entry<K, V> entry : originMap.entrySet()) {
        K key = entry.getKey();
        if (key != null) {
            ClassInfo classInfo = classResolver.getClassInfo(key.getClass(), keyClassInfoWriteCache);
            key = fury.copyObject(key, classInfo.getClassId());
        }
        V value = entry.getValue();
        if (value != null) {
            ClassInfo classInfo = classResolver.getClassInfo(value.getClass(), valueClassInfoWriteCache);
            value = fury.copyObject(value, classInfo.getClassId());
        }
        newMap.put(key, value);
    }
}

技术实现细节

1. 类型信息缓存机制

原有的getOrUpdateClassInfo方法虽然使用了类信息缓存，但在处理嵌套结构时可能被覆盖。新方案引入了专门的写缓存（writeCache）来保证：

键值类型信息在Map拷贝过程中保持稳定
避免多级嵌套拷贝导致的缓存污染

2. 类ID直接传递

优化后的copyObject方法可以直接接收类ID参数，省去了类型解析步骤：

对于基本类型和常见包装类型，直接返回原对象
对于数组类型，使用高效的Arrays.copyOf
对于集合类型，调用对应的序列化器

3. 适用范围扩展

该优化不仅适用于Map结构，同样可以应用于：

Collection集合的深度拷贝
对象数组的深度拷贝
其他需要批量处理同类型元素的场景

性能收益

通过这种优化，Fury在以下场景可以获得显著性能提升：

大型Map的深度拷贝（元素数量多）
嵌套Map/Collection结构
键值类型单一的Map实例
高频调用的序列化/反序列化场景

最佳实践建议

开发者在使用Fury进行深度拷贝时，可以注意：

尽量保持Map键值类型的一致性
对于已知类型的Map，考虑使用特定类型的序列化器
在性能敏感场景，优先使用优化后的拷贝API

这种优化体现了Fury团队在性能优化上的精细思考，通过减少不必要的类型解析开销，显著提升了框架在高并发、大数据量场景下的表现。

A blazingly fast multi-language serialization framework for idiomatic domain objects, schema IDL, and cross-language data exchange.

项目地址：https://gitcode.com/gh_mirrors/fu/fory

登录后查看全文

项目优选

收起

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

flutter_flutter

Oohos_react_native

React Native鸿蒙化仓库

昇腾LLM分布式训练框架

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统