Apache Doris 查询熔断机制详解:SQL阻塞规则与工作负载策略
2025-06-27 13:07:12作者:齐添朝
概述
在现代数据库系统中,查询熔断机制是保障系统稳定性的重要手段。Apache Doris 提供了两种类型的熔断策略:SQL阻塞规则(SQL Block Rule)和工作负载策略(Workload Policy)。本文将深入解析这两种机制的原理、应用场景及使用方法。
SQL阻塞规则(SQL Block Rule)
SQL阻塞规则是一种在查询计划阶段实施的预防性熔断机制,主要用于阻止特定模式的SQL语句执行。
核心特性
- 作用时机:在查询计划阶段生效
- 适用对象:适用于所有SQL语句,包括DDL和DML
- 规则类型:
- 扫描行数限制
- 扫描分区数限制
- 扫描桶数限制
- 正则表达式匹配
- SQL哈希值匹配
规则分类
按作用范围分类
- 全局级阻塞规则:对所有用户生效
- 用户级阻塞规则:仅对指定用户生效
按匹配方式分类
- 资源限制型:限制扫描行数/分区数/桶数
- 模式匹配型:通过正则表达式或哈希值匹配SQL语句
实战应用
1. 创建全局阻塞规则
CREATE SQL_BLOCK_RULE rule_001
PROPERTIES (
"sql"="select \\* from t",
"global" = "true",
"enable" = "true"
)
此规则将阻止所有用户执行select * from t查询。
2. 创建用户级阻塞规则
CREATE SQL_BLOCK_RULE rule_001
PROPERTIES (
"sql"="select * from t",
"global" = "false",
"enable" = "true"
)
然后为指定用户启用该规则:
set property for 'root' 'SQL_block_rules' = 'rule_001';
3. 限制扫描行数
CREATE SQL_BLOCK_RULE rule_card
PROPERTIES(
"cardinality" = "1000",
"global" = "true",
"enable" = "true"
);
此规则将阻止单表扫描超过1000行的查询。
4. 限制扫描分区数
CREATE SQL_BLOCK_RULE rule_part_num
PROPERTIES(
"partition_num" = "30",
"global" = "true",
"enable" = "true"
);
此规则将阻止单表扫描超过30个分区的查询。
5. 限制扫描桶数
CREATE SQL_BLOCK_RULE rule_tablet_num
PROPERTIES(
"tablet_num" = "200",
"global" = "true",
"enable" = "true"
);
此规则将阻止单表扫描超过200个桶的查询。
6. 阻止特定函数使用
CREATE SQL_BLOCK_RULE rule_abs
PROPERTIES(
"sql"="(?i)abs\\s*\\(.+\\)",
"global"="true",
"enable"="true"
);
此规则将阻止所有使用abs()函数的查询。
注意事项
- 正则表达式性能:复杂正则表达式会增加FE的CPU负载
- 规则估算误差:资源限制型规则基于计划阶段估算,可能存在误判
- 规则优先级:多个规则同时匹配时,优先级高的规则生效
工作负载策略(Workload Policy)
工作负载策略是一种运行时熔断机制,通过实时监控查询执行状态来实施熔断。
核心特性
- 作用时机:在查询执行阶段生效
- 监控指标:
- 查询执行时间
- 单BE扫描行数
- 单BE扫描字节数
- 单BE内存使用量
- 执行动作:
- 取消查询
- 设置会话变量
版本支持
自Doris 2.1版本起支持工作负载策略,支持以下操作类型:
- SELECT查询
- INSERT INTO SELECT
- 流式导入
- 例行导入
实战应用
1. 创建基本策略
create workload policy test_cancel_policy
Conditions(query_time > 1000)
Actions(cancel_query)
properties('enabled'='true');
此策略将在查询执行超过1秒时取消查询。
2. 绑定工作负载组
create workload policy test_cancel_big_query
Conditions(query_time > 1000)
Actions(cancel_query)
properties('workload_group'='normal')
此策略仅对"normal"工作负载组的查询生效。
3. 修改会话变量
create workload Policy test_set_var_policy
Conditions(username='admin')
Actions(set_session_variable 'parallel_fragment_exec_instance_num=1')
此策略将修改admin用户的并发参数。
注意事项
- 执行延迟:策略检查存在约500ms的延迟
- 策略冲突:多个策略匹配时,优先级高的生效
- 修改限制:策略条件和动作不支持直接修改,需删除重建
总结
Apache Doris的查询熔断机制提供了从计划阶段到执行阶段的全方位保护:
- SQL阻塞规则:适合预防已知的高风险查询模式
- 工作负载策略:适合应对运行时出现的异常查询
合理配置这两种机制,可以有效保障Doris集群的稳定性和可用性。建议根据实际业务场景,结合两种机制的优势,构建多层次的防护体系。
登录后查看全文
热门项目推荐
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust0191
cann-learning-hubCANN 学习中心仓,支持在线互动运行、边学边练,提供教程、示例与优化方案,一站式助力昇腾开发者快速上手。Jupyter Notebook0118
Step-3.7-FlashStep-3.7-Flash是一个拥有 1980 亿参数的稀疏混合专家(MoE)视觉语言模型,由 1960 亿参数的语言主干网络和 18 亿参数的视觉编码器组合而成,具备原生图像理解能力。Python00
JoyAI-EchoJoyAI-Echo,这是一个独立的、仅用于推理的版本,旨在实现分钟级多镜头音视频生成。它采用了经过蒸馏的DMD生成器、配对的跨模态记忆以及故事级别的一致性。其性能的核心在于,一个跨模态视听记忆库能够在长达五分钟的视频中保持角色外观和语音音色的一致性。同时,一个训练后处理流程将基于记忆的强化学习与分布匹配蒸馏相结合,实现了7.5倍的速度提升,显著增强了视觉质量和对齐效果。00
fun-rec推荐系统入门教程,在线阅读地址:https://datawhalechina.github.io/fun-rec/Python03
so-large-lm大模型基础: 一文了解大模型基础知识01
项目优选
收起
暂无描述
Dockerfile
765
4.97 K
本项目是CANN提供的transformer类大模型算子库,实现网络在NPU上加速计算。
C++
857
1.93 K
本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。
C++
680
1.33 K
Ascend Extension for PyTorch
Python
719
879
deepin linux kernel
C
32
16
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
456
438
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
1.08 K
1.1 K
华为昇腾面向大规模分布式训练的多模态大模型套件,支撑多模态生成、多模态理解。
Python
151
252
CANN 学习中心仓,支持在线互动运行、边学边练,提供教程、示例与优化方案,一站式助力昇腾开发者快速上手。
Jupyter Notebook
303
118
昇腾LLM分布式训练框架
Python
178
220