Apache Kyuubi 中的查询超时线程泄漏问题分析与修复

2025-07-08 03:32:07作者：宣海椒Queenly

Apache Kyuubi is a distributed and multi-tenant gateway to provide serverless SQL on data warehouses and lakehouses.

项目地址：https://gitcode.com/gh_mirrors/kyuubi1/kyuubi

问题背景

在分布式SQL查询引擎Apache Kyuubi的最新开发版本中，发现了一个潜在的线程泄漏问题。这个问题涉及到查询超时管理机制中的线程资源未能正确释放，可能导致系统资源逐渐耗尽，影响服务稳定性。

问题现象

当Kyuubi的会话管理器(Session Manager)中的线程池(ThreadPoolExecutor)拒绝执行异步操作(asyncOperation)时，系统创建的"query-timeout-thread"线程未能被正确关闭。这些未被关闭的线程会持续占用系统资源，随着时间推移可能导致线程数不断增长，最终影响系统性能。

技术原理分析

Kyuubi作为分布式SQL查询引擎，在处理查询请求时会采用多线程机制来提高并发性能。其中查询超时管理是一个重要功能，它通过专门的"query-timeout-thread"线程来监控查询执行时间，确保长时间运行的查询能够被及时终止，避免资源被无限占用。

在正常情况下，当查询完成或超时后，相关的监控线程应该被正确清理。但在特定场景下，当线程池已满并拒绝新任务时，系统未能正确处理这种情况下的资源回收，导致监控线程泄漏。

影响范围

该问题主要影响Kyuubi的主干开发版本(master分支)，在高并发场景下当系统负载达到线程池上限时可能出现。长期运行的系统会逐渐积累这些泄漏的线程，最终可能导致：

系统线程数超出限制
内存资源被无效占用
监控和管理开销增加
潜在的性能下降问题

解决方案

修复方案主要围绕完善线程生命周期管理机制展开：

确保在任何情况下(包括任务被拒绝时)都能正确关闭超时监控线程
增加异常处理逻辑，在任务提交失败时主动清理已创建的资源
优化线程创建和关闭的流程，确保资源释放的可靠性

实现细节

修复代码主要改进了以下几个方面：

在任务提交逻辑中增加了更完善的异常处理
确保在ThreadPoolExecutor拒绝任务时能够触发超时线程的关闭
优化了线程关闭的顺序和条件判断
增加了资源清理的防御性编程

最佳实践建议

对于使用Kyuubi的开发者和运维人员，建议：

定期监控系统的线程数量变化
合理配置线程池大小，避免频繁出现任务拒绝情况
及时升级到包含此修复的版本
在高负载场景下关注系统资源使用情况

总结

线程泄漏是分布式系统中常见但危害较大的问题。Kyuubi社区对此问题的快速响应和修复体现了项目对系统稳定性的高度重视。通过这次修复，Kyuubi的查询超时管理机制变得更加健壮，能够更好地应对高并发场景下的各种边界条件。

对于系统开发者而言，这也提醒我们在设计异步任务和线程管理时需要特别注意资源清理的完整性，特别是在异常情况下的处理逻辑。完善的资源管理机制是构建稳定可靠的分布式系统的重要基础。

Apache Kyuubi is a distributed and multi-tenant gateway to provide serverless SQL on data warehouses and lakehouses.

项目地址：https://gitcode.com/gh_mirrors/kyuubi1/kyuubi

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

昇腾LLM分布式训练框架

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统