Apache Arrow DataFusion中的SortPreservingMergeStream忙等待问题分析

2025-06-13 13:46:59作者：龚格成

arrow-datafusion

Apache Arrow DataFusion SQL Query Engine

项目地址：https://gitcode.com/gh_mirrors/arr/arrow-datafusion

在Apache Arrow DataFusion项目中，SortPreservingMergeStream组件在处理大规模数据排序时出现了一个性能问题。这个问题表现为当执行类似select a from annotated_data_infinite2 order by b desc limit 10这样的查询时，系统会进入一个忙等待循环，导致CPU资源被无谓消耗。

问题背景

SortPreservingMergeStream是DataFusion中用于合并已排序分区的关键组件。它的设计初衷是在保持排序顺序的同时，高效地合并来自多个分区的数据流。然而，在实际运行过程中，当处理大规模数据集时，该组件会频繁地唤醒当前任务进行重新调度，而实际上大多数输入流在初始排序阶段都处于等待状态。

问题表现

当SortPreservingMergeStream的poll_next_inner方法被调用时，如果所有输入流都处于pending状态，它会执行一个自我唤醒操作。这个设计在数据量大的情况下会导致以下问题：

在初始排序阶段，所有输入流都会长时间处于pending状态
系统不断执行唤醒-检查的循环
CPU资源被大量消耗在这个无实际进展的循环中

技术分析

这个问题源于一个看似合理的优化决策。原本的设计意图可能是为了避免长时间阻塞，通过定期唤醒任务来检查是否有进展。然而，这种设计在特定场景下反而造成了反效果：

当处理大规模数据时，初始排序阶段本身就是耗时的
频繁的唤醒操作打断了正常的处理流程
系统资源被浪费在不必要的上下文切换上

解决方案思路

针对这个问题，可以考虑以下几种改进方向：

引入合理的退避机制，在检测到所有输入流都处于pending状态时，适当延长下次唤醒的间隔
根据数据规模动态调整唤醒策略，大数据量时减少不必要的唤醒
保留原始设计中对小数据集的快速响应能力，同时避免在大数据集场景下的忙等待

影响评估

这个性能问题虽然不会导致功能错误，但对系统资源利用率和查询性能有显著影响：

增加了CPU使用率，可能导致系统整体吞吐量下降
延长了查询响应时间，特别是对于大数据集排序操作
在资源受限的环境中，这个问题的影响会更加明显

总结

SortPreservingMergeStream的忙等待问题是典型的高性能系统设计中的权衡问题。它提醒我们在设计异步处理系统时，不仅要考虑功能正确性，还需要仔细评估各种场景下的性能表现。特别是在处理大规模数据时，简单的"唤醒-检查"机制可能适得其反，需要更精细的调度策略来平衡响应性和资源利用率。

arrow-datafusion

Apache Arrow DataFusion SQL Query Engine

项目地址：https://gitcode.com/gh_mirrors/arr/arrow-datafusion

登录后查看全文

项目优选

收起

deepin linux kernel

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

🍒 Cherry Studio 是一款支持多个 LLM 提供商的桌面客户端

flutter_flutter

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用