Apache Kyuubi 新增 Server Local 引擎共享级别优化资源分配

2025-07-03 19:05:50作者：邵娇湘

Apache Kyuubi 作为企业级数据湖分析服务网关，近期社区针对引擎资源分配策略进行了重要优化，新增了 Server Local 共享级别（ShareLevel），这一改进将显著提升集群资源利用效率。

背景与需求

在多节点部署环境中，Kyuubi 服务器与引擎通常分布在不同的节点上运行。然而在某些特定场景下，用户希望将引擎调度到与 Kyuubi 服务器相同的物理节点上运行，这种需求主要基于以下考虑：

资源均衡分配：避免某些节点因运行过多引擎而成为热点
网络开销优化：减少跨节点通信带来的网络延迟
资源隔离：实现特定业务场景下的资源隔离需求

技术实现方案

新引入的 Server Local 共享级别通过以下机制实现：

引擎调度策略：当配置为 SERVER_LOCAL 共享级别时，Kyuubi 会优先在与服务器相同的节点上启动引擎
资源管理：与现有共享级别（USER、GROUP 等）兼容，共享策略保持一致
故障转移：当本地节点资源不足时，具备自动降级到其他节点的能力

配置与使用

用户可以通过以下方式启用 Server Local 共享级别：

kyuubi.engine.share.level=SERVER_LOCAL

该特性与现有配置体系完全兼容，无需额外参数即可工作。对于需要更精细控制的场景，可以结合以下配置使用：

kyuubi.engine.share.level=SERVER_LOCAL
kyuubi.session.engine.launch.max.attempts=3
kyuubi.engine.share.level.subdomain=production

实现原理

在技术实现上，主要修改了引擎调度模块：

节点感知：引擎管理器能够识别 Kyuubi 服务器所在节点
调度优先级：在资源请求时优先匹配本地节点资源
资源预留：为本地节点预留部分资源以保证关键业务需求

性能影响与最佳实践

经过社区测试，该特性在以下场景表现最佳：

中等规模集群（20-100节点）：资源分配均衡效果显著
混合负载场景：同时存在长时查询和短时交互式查询
资源敏感型应用：对网络延迟敏感的分析任务

建议用户在实际部署时考虑：

本地节点预留适当资源缓冲
监控引擎分布情况，避免单节点过载
结合 Kubernetes 或 YARN 的节点标签功能实现更精细控制

未来展望

Server Local 共享级别的引入为 Kyuubi 的资源管理提供了更多可能性，社区未来可能会在此基础上发展出：

智能位置感知：基于网络拓扑的自动优化
动态资源调整：根据负载自动调整本地预留资源
多级共享策略：组合多种共享级别实现复杂场景需求

这一改进充分体现了 Kyuubi 社区对实际生产需求的快速响应能力，为企业级部署提供了更灵活的资源配置方案。

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

Python

2.25 K

677