Fury项目中的分块预测式Map序列化协议优化

2025-06-25 09:56:35作者：平淮齐Percy

背景介绍

在Apache Fury跨语言序列化框架中，Map数据结构的序列化性能一直是优化的重点。传统的Map序列化方式在处理大量数据时存在性能瓶颈，特别是在处理异构键值类型时，需要频繁进行类型检查和元数据处理，导致序列化效率低下。

问题分析

Fury项目团队发现，现有的Map序列化方案存在两个主要问题：

在序列化过程中计算头部信息会引入显著的开销
当键值类型不一致时，无法有效预测序列化格式，导致性能下降

解决方案：分块预测式序列化协议

Fury团队设计了一种创新的分块预测式Map序列化协议，该协议通过以下机制显著提升性能：

基本格式

协议采用分块结构，整体格式如下：

| 长度(无符号变长整数) | 键值块数据 | ... | 键值块数据 |

键值块数据结构

每个块最多包含255个键值对，采用紧凑的二进制格式：

| 1字节块大小 | 1字节KV头部 | N*2个对象数据 |

KV头部设计

KV头部使用1字节(8位)编码丰富的元信息：

第1位：是否跟踪键引用
第2位：键是否可能为null
第3位：键类型是否不一致
第4位：实际键类型是否与声明类型不同
第5位：是否跟踪值引用
第6位：值是否可能为null
第7位：值类型是否不一致
第8位：实际值类型是否与声明类型不同

预测机制

协议采用智能预测策略：

优先使用用户通过MapFieldInfo注解提供的头部信息
若无注解，则使用第一个键值对预测头部信息
当预测失败时动态更新块头部

流式写入优化

对于流式写入场景(无法更新已写入的块大小)，协议简化为：

| 1字节KV头部 | N*2个对象数据 |

技术优势

性能提升：通过分块处理减少元数据计算开销，实测可达2倍性能提升
空间效率：大多数Map大小小于255，单块即可容纳，减少头部开销
类型处理：智能处理异构类型，将不同类型分配到不同块中
流式支持：优化流式场景下的序列化效率

实现考量

实现时需要注意：

需要维护块计数与总大小的关系
针对不同语言特性优化(如Golang/Rust的非引用默认特性)
为常见场景生成特化的反序列化代码

总结

Fury的分块预测式Map序列化协议通过创新的分块结构和智能预测机制，有效解决了传统序列化方案在元数据处理和异构类型处理上的性能瓶颈。该设计不仅提升了序列化效率，还保持了协议的灵活性和扩展性，是高性能序列化领域的重要进步。

fory

A blazingly fast multi-language serialization framework for idiomatic domain objects, schema IDL, and cross-language data exchange.

项目地址：https://gitcode.com/gh_mirrors/fu/fory

登录后查看全文

项目优选

收起

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

433

393

MindSpeed-MM

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.67 K

987