Apache Kyuubi项目支持Spark 3.3版本的Scala 2.13兼容性分析
Apache Kyuubi是一个开源的分布式SQL引擎服务,它提供了JDBC接口,使得用户可以通过标准SQL访问大数据平台。在最新开发中,社区正在推动对Spark 3.3版本中Scala 2.13的支持工作,这一改进将显著提升项目的兼容性和灵活性。
Scala作为Spark的核心编程语言,其版本兼容性一直是生态系统中的重要考量。目前Spark 3.3版本主要支持Scala 2.12,但随着Scala语言的演进,越来越多的项目开始迁移到2.13版本。这种版本迁移带来了更好的性能优化、语言特性改进和更现代的API设计。
对于Kyuubi项目而言,支持Scala 2.13意味着能够更好地满足下游项目的需求。以Gravitino项目为例,作为一个元数据管理平台,它需要同时支持多个Scala版本以保持与不同生态组件的兼容性。当前缺乏对Scala 2.13的支持使得这类下游项目在版本管理上面临挑战。
技术实现上,这项工作主要涉及以下几个方面:
-
构建系统的调整:需要在Maven或SBT构建配置中添加Scala 2.13的支持,确保能够正确编译和打包。
-
依赖库的兼容性检查:需要验证所有依赖的第三方库是否都有对应的Scala 2.13版本可用。
-
代码兼容性审查:虽然Scala 2.12和2.13之间保持了较高的二进制兼容性,但仍需检查是否有使用已弃用或移除的API。
-
测试验证:需要确保所有功能测试在Scala 2.13环境下都能正常运行。
-
发布流程更新:需要配置CI/CD系统以支持多Scala版本的构建和发布。
这项改进完成后,Kyuubi将能够为使用Spark 3.3和Scala 2.13的用户提供更好的支持,同时也为整个生态系统向更新版本过渡铺平道路。对于开发者社区而言,这意味着更灵活的集成选择和更少的版本冲突问题。
从长远来看,支持多Scala版本是开源项目保持生态活力的重要策略。它不仅能够满足不同用户的技术栈需求,还能促进项目自身的可持续发展。随着Scala语言的持续演进,Kyuubi项目的这一改进将帮助用户更平滑地过渡到未来的版本。
Kimi-K2.5Kimi K2.5 是一款开源的原生多模态智能体模型,它在 Kimi-K2-Base 的基础上,通过对约 15 万亿混合视觉和文本 tokens 进行持续预训练构建而成。该模型将视觉与语言理解、高级智能体能力、即时模式与思考模式,以及对话式与智能体范式无缝融合。Python00
PaddleOCR-VL-1.5PaddleOCR-VL-1.5 是 PaddleOCR-VL 的新一代进阶模型,在 OmniDocBench v1.5 上实现了 94.5% 的全新 state-of-the-art 准确率。 为了严格评估模型在真实物理畸变下的鲁棒性——包括扫描伪影、倾斜、扭曲、屏幕拍摄和光照变化——我们提出了 Real5-OmniDocBench 基准测试集。实验结果表明,该增强模型在新构建的基准测试集上达到了 SOTA 性能。此外,我们通过整合印章识别和文本检测识别(text spotting)任务扩展了模型的能力,同时保持 0.9B 的超紧凑 VLM 规模,具备高效率特性。Python00
xw-cli实现国产算力大模型零门槛部署,一键跑通 Qwen、GLM-4.7、Minimax-2.1、DeepSeek-OCR 等模型Go06
yuanrongopenYuanrong runtime:openYuanrong 多语言运行时提供函数分布式编程,支持 Python、Java、C++ 语言,实现类单机编程高性能分布式运行。Go051
MiniCPM-SALAMiniCPM-SALA 正式发布!这是首个有效融合稀疏注意力与线性注意力的大规模混合模型,专为百万级token上下文建模设计。00
ebook-to-mindmapepub、pdf 拆书 AI 总结TSX01