Apache Kyuubi 中 Spark History Server 显示不完整应用时的类型转换问题分析
问题背景
在 Apache Kyuubi 项目中,当用户通过 Spark History Server 查看不完整的应用程序时,会遇到一个类型转换异常。具体表现为访问 Kyuubi 查询引擎 UI 时出现 HTTP 500 错误,错误信息显示无法将 java.lang.Integer 转换为 java.lang.Long。
错误现象
用户在使用 Spark 3.3.2 版本时,通过 ApplicationMaster 直接访问 Kyuubi Query Engine 页面可以正常显示,但当通过 Spark History Server 查看"不完整应用"中的 Kyuubi Query Engine 时,会出现以下错误:
HTTP ERROR 500 java.lang.ClassCastException: java.lang.Integer cannot be cast to java.lang.Long
堆栈跟踪显示错误发生在 Spark UI 的 StatementStatsPagedTable.row 方法中,具体是在处理 EnginePage 相关数据时发生的类型转换问题。
问题根源
经过分析,这个问题与 Jackson 库在处理 Scala 类型时的行为有关。具体来说,当 Jackson 反序列化某些数值类型时,可能会将原本应为 Long 类型的值反序列化为 Integer 类型,从而导致后续的类型转换失败。
这个问题类似于 Jackson 模块中已知的一个问题,即在处理 Scala 集合和数值类型时可能出现的类型不匹配情况。
解决方案
针对这个问题,社区提出了两种解决方案:
- 直接修改相关字段的类型定义,确保类型一致性
- 使用 Jackson 的 @JsonDeserialize 注解显式指定反序列化类型
最终采用了第二种更为优雅的解决方案,即在 operationRunTime 和 operationCpuTime 字段上添加注解:
@JsonDeserialize(contentAs = classOf[java.lang.Long])
这个注解明确告诉 Jackson 在反序列化时将内容转换为 java.lang.Long 类型,从而避免了后续的类型转换异常。
技术意义
这个修复不仅解决了眼前的问题,还具有以下技术意义:
- 增强了 Kyuubi 与 Spark History Server 的兼容性
- 提供了更健壮的类型处理机制
- 为类似的数据类型转换问题提供了参考解决方案
总结
在分布式系统和大数据处理框架中,类型系统的正确处理至关重要。Apache Kyuubi 作为 Spark SQL 的接口服务,需要确保在各种环境下都能正确处理数据类型。这次问题的解决展示了开源社区如何通过协作快速定位和修复复杂系统中的类型相关问题,提高了系统的稳定性和可靠性。
kernelopenEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。C075
MiniMax-M2.1从多语言软件开发自动化到复杂多步骤办公流程执行,MiniMax-M2.1 助力开发者构建下一代自主应用——全程保持完全透明、可控且易于获取。Python00
kylin-wayland-compositorkylin-wayland-compositor或kylin-wlcom(以下简称kywc)是一个基于wlroots编写的wayland合成器。 目前积极开发中,并作为默认显示服务器随openKylin系统发布。 该项目使用开源协议GPL-1.0-or-later,项目中来源于其他开源项目的文件或代码片段遵守原开源协议要求。C01
PaddleOCR-VLPaddleOCR-VL 是一款顶尖且资源高效的文档解析专用模型。其核心组件为 PaddleOCR-VL-0.9B,这是一款精简却功能强大的视觉语言模型(VLM)。该模型融合了 NaViT 风格的动态分辨率视觉编码器与 ERNIE-4.5-0.3B 语言模型,可实现精准的元素识别。Python00
GLM-4.7GLM-4.7上线并开源。新版本面向Coding场景强化了编码能力、长程任务规划与工具协同,并在多项主流公开基准测试中取得开源模型中的领先表现。 目前,GLM-4.7已通过BigModel.cn提供API,并在z.ai全栈开发模式中上线Skills模块,支持多模态任务的统一规划与协作。Jinja00
agent-studioopenJiuwen agent-studio提供零码、低码可视化开发和工作流编排,模型、知识库、插件等各资源管理能力TSX0130
Spark-Formalizer-X1-7BSpark-Formalizer 是由科大讯飞团队开发的专用大型语言模型,专注于数学自动形式化任务。该模型擅长将自然语言数学问题转化为精确的 Lean4 形式化语句,在形式化语句生成方面达到了业界领先水平。Python00