Apache Kyuubi 中 Flink SQL 引擎的代理用户模式实现

2025-07-05 18:18:30作者：龚格成

Apache Kyuubi is a distributed and multi-tenant gateway to provide serverless SQL on data warehouses and lakehouses.

项目地址：https://gitcode.com/gh_mirrors/kyuub/kyuubi

背景介绍

Apache Kyuubi 作为一个企业级数据湖管理平台，提供了多租户环境下的统一SQL查询接口。在实际生产环境中，经常需要支持代理用户(impersonation)模式，即允许一个用户以另一个用户的身份执行操作。本文将深入探讨如何在Kyuubi中为Flink SQL引擎实现代理用户模式。

技术挑战

在实现Flink SQL引擎的代理用户模式时，主要面临以下技术难点：

安全令牌传递问题：当关闭security.delegation.tokens.enabled时，JobManager无法将委托令牌更新传递给TaskManager，这会导致任务执行失败。
多组件集成：Flink生态中涉及多种安全模块，包括Hadoop文件系统、S3存储、HiveServer2和HBase等，需要统一协调这些组件的安全配置。

解决方案设计

核心思路

通过实现自定义的令牌提供者和接收器，同时精细控制各个安全模块的启用状态，来实现安全且灵活的代理用户模式。

具体实现方案

自定义令牌组件：
- 开发KyuubiDelegationTokenProvider：负责生成和管理代理用户的安全令牌
- 开发KyuubiDelegationTokenReceiver：负责在TaskManager端接收和验证令牌
关键配置参数：
- HADOOP_PROXY_USER：指定代理用户名称
- security.module.factory.classes：配置安全模块工厂类，包括Jaas和Zookeeper模块
- 禁用原生令牌提供者：
  - security.delegation.token.provider.hadoopfs.enabled=false
  - security.delegation.token.provider.s3-hadoop.enabled=false
  - security.delegation.token.provider.s3-presto.enabled=false
  - security.delegation.token.provider.HiveServer2.enabled=false
  - security.delegation.token.provider.hbase.enabled=false

实现细节

安全模块加载机制

通过security.module.factory.classes配置，系统将按顺序加载以下安全模块：

JaasModuleFactory：提供基于JAAS的身份验证
ZookeeperModuleFactory：处理Zookeeper相关安全配置

令牌管理流程

用户提交作业时，Kyuubi前端服务会验证原始用户是否有权代理目标用户
通过后，KyuubiDelegationTokenProvider会生成代理用户的安全令牌
令牌通过安全通道传递给JobManager
JobManager将令牌分发给各个TaskManager
TaskManager通过KyuubiDelegationTokenReceiver接收并验证令牌

性能与安全考量

性能优化：
- 令牌缓存机制减少重复生成开销
- 异步令牌刷新避免阻塞主流程
安全增强：
- 实现令牌有效期检查
- 支持令牌自动续期
- 详细的审计日志记录

实际应用效果

该方案已在生产环境验证，能够：

支持多租户场景下的安全隔离
保持Flink作业的正常执行流程
提供细粒度的访问控制
满足企业级安全合规要求

总结

通过自定义令牌管理和精细的安全配置，Kyuubi成功实现了Flink SQL引擎的代理用户模式。这一方案不仅解决了原生Flink在代理用户场景下的局限性，还为多租户环境提供了更灵活、更安全的数据访问控制能力。未来可以考虑进一步优化令牌管理机制，支持更复杂的代理场景和更细粒度的权限控制。

Apache Kyuubi is a distributed and multi-tenant gateway to provide serverless SQL on data warehouses and lakehouses.

项目地址：https://gitcode.com/gh_mirrors/kyuub/kyuubi

登录后查看全文

项目优选

收起

deepin linux kernel

Ascend Extension for PyTorch

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件，通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求，让密码技术应用更简单，同时探索后量子等先进算法创新实践，构建密码前沿技术底座！

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

昇腾LLM分布式训练框架

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

flutter_flutter