Apache Kyuubi 增强 beeline 工具支持 --conf 参数配置
2025-07-08 11:20:02作者:秋阔奎Evelyn
背景介绍
Apache Kyuubi 是一个开源的分布式 SQL 引擎,提供了 JDBC 接口和命令行工具 kyuubi-beeline 来与 Kyuubi 服务进行交互。kyuubi-beeline 是基于 Apache Hive 的 beeline 工具开发的,继承了其大部分功能和参数选项。
当前问题
在现有版本中,kyuubi-beeline 主要通过 --hiveconf 和 --hivevar 参数来传递配置项。例如:
kyuubi-beeline -u 'jdbc:kyuubi://kyuubi:10009/' \
--hiveconf kyuubi.operation.result.format=arrow \
--hiveconf kyuubi.operation.incremental.collect=true \
--hivevar spark.app.name=xxx \
large_result_query.sql
这种方式虽然可行,但对于熟悉 Spark 生态的用户来说不够直观。在 Spark 生态中,配置参数通常使用 --conf 选项传递,例如:
spark-submit \
--conf spark.app.name=xxx \
--conf spark.driver.memory=1g
...
解决方案
为了提升用户体验和保持与 Spark 生态的一致性,Kyuubi 社区决定为 kyuubi-beeline 工具增加 --conf 参数支持。这个新参数将作为 --hiveconf 的别名,功能完全一致。
新的使用方式如下:
kyuubi-beeline -u 'jdbc:kyuubi://kyuubi:10009/' \
--conf kyuubi.operation.result.format=arrow \
--conf kyuubi.operation.incremental.collect=true \
--conf spark.app.name=xxx \
large_result_query.sql
实现细节
这个改进的实现相对简单,主要是在命令行参数解析部分增加 --conf 作为 --hiveconf 的别名。两者将共享相同的参数处理逻辑,确保行为完全一致。
兼容性考虑
为了保持向后兼容性,原有的 --hiveconf 和 --hivevar 参数仍然会被支持。新增加的 --conf 参数只是提供了另一种更符合 Spark 用户习惯的配置方式。
用户价值
- 降低学习成本:Spark 用户可以沿用熟悉的
--conf参数语法,无需额外学习--hiveconf的使用方式 - 提升一致性:使 Kyuubi 的命令行工具与 Spark 生态保持一致的配置风格
- 增强可用性:为用户提供更多选择,可以根据个人偏好选择配置方式
总结
这个改进虽然看似简单,但体现了 Kyuubi 项目对用户体验的重视。通过保持与 Spark 生态的一致性,降低了用户的学习成本和使用门槛,有助于 Kyuubi 在 Spark 生态中的进一步推广和应用。
登录后查看全文
热门项目推荐
相关项目推荐
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust0214
cann-learning-hubCANN 学习中心仓,支持在线互动运行、边学边练,提供教程、示例与优化方案,一站式助力昇腾开发者快速上手。Jupyter Notebook0138
uni-appA cross-platform framework using Vue.jsJavaScript08
GLM-5.2智谱开源 GLM-5.2,这是针对长文本任务的最新旗舰模型。相较于前代产品 GLM-5.1,它在长文本任务处理能力上实现了显著飞跃,并且首次在稳定的 100 万 token 上下文中提供这一能力。Jinja00
SwanLab⚡️SwanLab - an open-source, modern-design AI training tracking and visualization tool. Supports Cloud / Self-hosted use. Integrated with PyTorch / Transformers / LLaMA Factory / veRL/ Swift / Ultralytics / MMEngine / Keras etc.Python00
tiny-universe《大模型白盒子构建指南》:一个全手搓的Tiny-UniverseJupyter Notebook03
项目优选
收起
deepin linux kernel
C
32
16
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
469
465
暂无描述
Dockerfile
778
5.08 K
本项目是CANN提供的transformer类大模型算子库,实现网络在NPU上加速计算。
C++
877
2.03 K
Ascend Extension for PyTorch
Python
758
968
本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。
C++
697
1.4 K
昇腾LLM分布式训练框架
Python
185
231
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
1.1 K
1.14 K
本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本,由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用,3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。
Dart
1.04 K
271
JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent,它能够将大语言模型的强大能力,通过你日常使用的各类通讯应用,直接延伸至你的指尖。
Python
2.25 K
677