Apache Kyuubi 项目中的 Atlas REST 地址配置问题解析

2025-07-04 19:54:59作者：明树来

问题背景

在 Apache Kyuubi 1.8.0 版本中，当用户配置了多个 Atlas REST 服务地址时，系统会出现配置读取失败的问题。这个问题主要发生在 Kyuubi 与 Apache Atlas 集成时，特别是在处理血缘关系(lineage)功能时。

问题现象

当用户按照 Atlas 的标准配置方式，在 atlas-application.properties 文件中配置多个 REST 服务地址时：

atlas.rest.address=http://bjbd-test-bigdata-atlas-002:21000,http://bjbd-test-bigdata-atlas-001:21000

系统会抛出 IllegalArgumentException 异常，提示"非法字符在 scheme 名称中"。

技术分析

根本原因

这个问题的根源在于 Java 集合类型的 toString 方法处理方式：

当 ApplicationProperties 类读取配置时，对于包含多个值的配置项，会返回一个 Java List 对象
Kyuubi 在处理这个配置时，没有针对 Java List 类型做特殊处理
系统直接调用了 List 的 toString 方法，该方法返回的字符串包含方括号"[ ]"
这个带有方括号的字符串被传递给 URI 解析器，导致解析失败

技术细节

在 Java 中，List 的 toString 方法实现会为每个元素调用其 toString 方法，并用逗号分隔，最后用方括号包裹整个字符串。例如：

List<String> addresses = Arrays.asList("http://host1:21000", "http://host2:21000");
System.out.println(addresses.toString()); 
// 输出: [http://host1:21000, http://host2:21000]

这个输出结果直接作为 URI 参数传递时，开头的"["字符会被 URI 解析器视为非法字符，因为它不是有效的 URI scheme 名称的一部分。

解决方案

要解决这个问题，需要修改 Kyuubi 处理 Atlas REST 地址配置的方式：

当读取到配置值是 List 类型时，应该提取其中的元素
将多个地址用逗号连接，但不包含方括号
或者直接处理 List 中的每个地址，而不是依赖 toString 方法

正确的处理逻辑应该是遍历 List 中的每个地址，分别进行验证和连接，而不是直接使用 List 的字符串表示形式。

影响范围

这个问题主要影响以下场景：

使用 Kyuubi 与 Atlas 集成的环境
配置了高可用 Atlas 集群，需要指定多个 REST 服务地址
使用血缘关系功能时

对于单节点 Atlas 部署，由于只配置一个地址，不会触发这个问题。

最佳实践

在实际部署中，建议：

对于生产环境，应该配置多个 Atlas REST 地址以实现高可用
等待此问题修复后升级 Kyuubi 版本
临时解决方案可以修改配置，只使用单个地址（不推荐用于生产环境）

总结

这个问题展示了在集成不同系统时，类型处理和字符串转换的重要性。开发人员在处理配置值时，需要考虑各种可能的输入类型，特别是当这些值来自不同的库或框架时。对于 Kyuubi 这样的中间件项目，正确处理上游系统的各种配置格式是保证系统稳定性的关键。

kyuubi

Apache Kyuubi is a distributed and multi-tenant gateway to provide serverless SQL on data warehouses and lakehouses.

项目地址：https://gitcode.com/gh_mirrors/ky/kyuubi

登录后查看全文

项目优选

收起

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

461

455

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

Dart

1.02 K

266