Apache Arrow C++模块中高并发哈希连接构建阶段的锁竞争优化

2025-05-15 17:08:05作者：田桥桑Industrious

在Apache Arrow项目的C++实现模块中，开发团队发现了一个影响性能的关键问题——在高并发场景下哈希连接(hash join)构建阶段出现的显著锁竞争。这个问题最初是在对哈希连接构建阶段进行基准测试时被发现的。

问题现象

当使用高并发线程执行哈希连接操作时，性能分析工具生成的火焰图显示，PartitionLocks::AcquirePartitionLock函数消耗了大量CPU时间。这个函数负责获取分区锁，由于采用了自旋锁(spin lock)实现，其高CPU占用在性能分析中表现得尤为明显。

技术背景

在哈希连接算法的构建阶段，系统需要将输入数据分散到不同的分区中。为了保证线程安全，每个分区都需要使用锁来保护。传统的实现方式是：

为每个分区分配一个独立的锁
线程访问分区前必须先获取对应的锁
高并发时多个线程可能同时竞争少量分区的锁

这种设计在高并发场景下会导致严重的锁竞争，因为线程数量通常远大于分区数量，特别是在数据分布不均匀时，某些"热点"分区的锁会成为性能瓶颈。

优化方案

开发团队通过以下方式解决了这个问题：

锁粒度调整：重新设计了锁的分配策略，减少锁竞争的可能性
算法优化：改进了分区策略，使数据分布更均匀
性能权衡：在锁开销和并行度之间找到更好的平衡点

实现细节

优化后的实现主要改进了分区锁的获取机制：

引入了更高效的分区锁定策略
减少了不必要的锁争用
优化了内存访问模式
保持了线程安全的同时提高了并行度

性能影响

这些优化显著提高了高并发场景下哈希连接操作的性能：

减少了CPU在锁等待上的时间消耗
提高了整体吞吐量
使性能随并发度提升更加线性

结论

这次优化展示了在高性能数据处理系统中，即使是看似简单的同步原语选择也可能对整体性能产生重大影响。通过细致的性能分析和针对性的优化，Apache Arrow团队成功解决了哈希连接构建阶段的并发瓶颈，为处理大规模数据提供了更好的性能基础。

arrow

Arrow是一个跨语言的内存格式，主要用于高效地传输和存储数据。它的特点是高效、灵活、易于使用等。适用于数据传输和存储场景。

项目地址：https://gitcode.com/GitHub_Trending/arrow3/arrow

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统