ClickHouse 24.4版本中ORDER BY DESC查询性能下降问题分析

2025-05-02 08:33:35作者：柏廷章Berta

在ClickHouse 24.4版本发布后，用户反馈在执行带有ORDER BY DESC和LIMIT的查询时出现了显著的性能下降。本文将从技术角度深入分析这个问题的成因、影响范围以及临时解决方案。

问题现象

用户在使用ClickHouse 24.4版本执行如下查询时发现了性能问题：

SELECT * FROM hits ORDER BY CounterID DESC LIMIT 1000 SETTINGS max_threads = 32

与24.3版本相比，24.4版本中该查询表现出以下异常特征：

执行时间从4.196秒增加到26.918秒
处理的数据量从50.31千行增加到292.54千行
内存使用从215.77MB激增至964.63MB

根本原因分析

通过深入调查，发现问题源于24.4版本中引入的多线程读取优化。具体表现为：

多线程读取机制变更：24.4版本开始使用多个线程并行读取单个数据部分(part)，旨在提高大范围数据扫描的性能
反向排序的特殊性：在ORDER BY DESC场景下，多个线程会重复读取相同的granule(数据颗粒)
资源浪费：测试显示最多有48个读取线程同时工作，导致大量冗余I/O操作

技术细节

在正常执行流程中：

每个线程尝试读取约1000行数据
由于是反向排序，多个线程会从不同偏移量开始读取
导致相同的数据granule被多个线程重复加载

通过查询计划分析发现：

Reading 21 ranges in reverse order from part 20130703-0_9_9_4
Reading 52 ranges in reverse order from part 20130703-0_9_9_4 
Reading 52 ranges in reverse order from part 20130703-0_9_9_4
...

相同part被多次读取，且读取范围有大量重叠。

临时解决方案

用户发现通过修改查询结构可以规避此问题：

SELECT * FROM (
    SELECT * FROM hits 
    ORDER BY CounterID DESC 
    LIMIT 1000000000000000000
    SETTINGS max_threads = 32
) LIMIT 1000

这种写法使得：

内层查询完整扫描数据并排序
外层仅做LIMIT过滤
执行计划变为顺序读取，避免了多线程重复读取

测试显示该方案使：

执行时间从7.404秒降至1.4秒
内存使用从1.14GB降至460MB
读取线程数从48降至17

版本影响范围

问题首次出现在24.4版本，与以下变更相关：

多线程读取优化引入
反向排序场景的特殊处理缺失
资源分配策略调整

24.3及之前版本不受此问题影响，保持原有的高效执行方式。

最佳实践建议

对于受影响的用户，建议：

在升级到24.4+版本时，评估ORDER BY DESC查询性能
对于关键查询，考虑使用上述临时解决方案
监控系统资源使用情况，特别是I/O和内存
关注后续版本中此问题的官方修复

该问题凸显了数据库优化中平衡并行度和资源使用的重要性，特别是在特殊查询场景下的边际效应。ClickHouse团队预计将在后续版本中针对此特定场景进行优化调整。

ClickHouse

ClickHouse® is a real-time analytics database management system

项目地址：https://gitcode.com/GitHub_Trending/cli/ClickHouse

登录后查看全文

项目优选

收起

Ascend Extension for PyTorch

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

427

377

openHiTLS

旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件，通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求，让密码技术应用更简单，同时探索后量子等先进算法创新实践，构建密码前沿技术底座！

1.09 K

610

ppt-master

AI 将任意文档转换为精美可编辑的 PPTX 演示文稿 — 无需设计基础 | 包含 15 个案例、229 页内容

Python

122

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

C++

992

988

ClickHouse 24.4版本中ORDER BY DESC查询性能下降问题分析

问题现象

根本原因分析

技术细节

临时解决方案

版本影响范围

最佳实践建议

热门内容推荐

最新内容推荐

项目优选

ClickHouse 24.4版本中ORDER BY DESC查询性能下降问题分析

问题现象

根本原因分析

技术细节

临时解决方案

版本影响范围

最佳实践建议

相关内容推荐

热门内容推荐

最新内容推荐

项目优选