Apache Fury 序列化框架中引用跟踪机制与兼容性模式解析

2025-06-25 03:15:06作者：裴麒琰

Apache Fury 是一个高性能的序列化框架，其引用跟踪机制（RefTracking）和兼容性模式（CompatibleMode）是保证数据序列化/反序列化正确性的重要特性。本文将深入探讨这两个机制的工作原理及常见问题场景。

引用跟踪机制的核心原理

引用跟踪机制是 Fury 序列化框架中的一项关键功能，主要用于处理循环引用和重复对象的序列化问题。当启用 withRefTracking(true) 时，框架会为每个对象分配唯一的引用ID，并在序列化过程中维护引用关系。

在实现层面，BaseObjectCodecBuilder 的 serializeFor 方法会判断是否需要写入引用标记（REF_VALUE_FLAG）。值得注意的是，即使 needToWriteRef 为 false，当值不为 null 时，框架仍会写入引用标记。这一设计是为了确保在跨系统通信时能正确处理对象引用关系。

兼容性模式的作用

兼容性模式（CompatibleMode.COMPATIBLE）是 Fury 提供的重要特性，它允许：

服务端新增字段时，客户端能够兼容旧版本数据
处理字段类型变更的情况
支持枚举类型的扩展

当服务端新增枚举字段时，兼容模式能确保客户端不会因无法识别新枚举值而报错，而是会采用合理的默认处理方式。

典型问题场景分析

在实际使用中，开发者可能会遇到以下典型问题：

新增枚举字段反序列化问题：当服务端新增枚举字段而客户端未更新时，在启用引用跟踪的情况下，如果处理不当可能导致引用解析错误。
跨版本引用解析异常：如示例中提到的，当类在反序列化端不存在时，MapRefResolver.tryPreserveRefId 可能会获取到错误的引用ID，这是因为引用跟踪机制依赖于完整的类信息。

最佳实践建议

对于需要长期保持兼容性的系统，建议同时启用引用跟踪和兼容模式：

Fury.builder()
    .withRefTracking(true)
    .withCompatibleMode(CompatibleMode.COMPATIBLE)
    .build();

在枚举类型扩展时，建议：
- 保持原有枚举值的顺序不变
- 新增枚举值放在最后
- 考虑实现自定义的枚举序列化策略
对于可能发生类变更的场景，建议实现自定义的类解析策略，确保类变更时能正确处理引用关系。

通过深入理解 Fury 的这些核心机制，开发者可以更好地构建具有良好兼容性和高性能的分布式系统。

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

Python

2.25 K

677