Apache Fury中Map深拷贝性能优化实践

2025-06-25 19:41:33作者：瞿蔚英Wynne

背景与问题分析

在Apache Fury这一高性能序列化框架中，Map结构的深拷贝操作是一个常见但可能存在性能瓶颈的场景。当处理大规模Map数据时，传统的逐项拷贝方式会频繁执行类型检查和序列化器查找，这些操作在循环中重复执行会导致不必要的性能开销。

性能瓶颈根源

通过分析源码发现，当前实现存在两个主要性能问题：

类型信息重复获取：每次调用copyObject方法时都会重新获取ClassInfo对象
类型检查冗余：对于同构Map（键值类型相同或相近），重复的类型检查可以优化

优化方案设计

优化核心思路是利用Map数据同构性的特点，通过缓存类型信息减少重复操作：

类型信息缓存：在进入循环前预先获取并缓存键值类型的ClassInfo
专用拷贝方法：新增支持传入预获取ClassInfo的copyObject方法重载
空值检查优化：在拷贝前进行空值检查，避免不必要的类型处理

实现细节

优化后的关键代码逻辑如下：

protected <K, V> void copyEntry(Map<K, V> originMap, Map<K, V> newMap) {
    ClassResolver classResolver = fury.getClassResolver();
    for (Map.Entry<K, V> entry : originMap.entrySet()) {
        K key = entry.getKey();
        if (key != null) {
            ClassInfo classInfo = classResolver.getClassInfo(key.getClass(), keyClassInfoWriteCache);
            key = fury.copyObject(key, classInfo.getClassId());
        }
        V value = entry.getValue();
        if (value != null) {
            ClassInfo classInfo = classResolver.getClassInfo(value.getClass(), valueClassInfoWriteCache);
            value = fury.copyObject(value, classInfo.getClassId());
        }
        newMap.put(key, value);
    }
}