首页
/ Kubeflow Spark Operator v2.2.0 版本深度解析

Kubeflow Spark Operator v2.2.0 版本深度解析

2025-06-17 15:00:24作者:江焘钦

Kubeflow Spark Operator 是一个 Kubernetes 原生工具,用于在 Kubernetes 集群上运行和管理 Apache Spark 应用程序。它通过自定义资源定义(CRD)扩展了 Kubernetes API,使得用户可以像管理其他 Kubernetes 资源一样管理 Spark 作业。最新发布的 v2.2.0 版本带来了多项重要更新和改进,本文将深入解析这些变化。

核心特性升级

Spark 3.5.5 支持

v2.2.0 版本将支持的 Spark 版本升级到了 3.5.5。这一升级意味着用户现在可以在 Kubernetes 上运行最新的 Spark 版本,获得性能改进、bug 修复和新功能。Spark 3.5 系列引入了多项优化,包括更好的 SQL 性能、增强的 Python 支持和改进的 Kubernetes 集成。

时区支持增强

对于 ScheduledSparkApplication(定时 Spark 应用),新版本增加了 timeZone 配置项。这一改进解决了跨时区调度作业的问题,使得用户可以根据业务需求精确控制作业的执行时间,特别是在全球分布式环境中运行时尤为重要。

内存限制覆盖机制

通过 webhook 添加了 MemoryLimit 的覆盖能力。这一功能增强了资源管理的灵活性,允许管理员在必要时覆盖用户设置的内存限制,确保集群资源的合理分配和使用,同时防止因配置不当导致的资源浪费或不足。

架构改进

动态分配增强

新增了 ShuffleTrackingEnabled 配置项到 DynamicAllocation 结构中。这一改进允许用户根据需要禁用 shuffle 跟踪功能,为特定场景下的性能调优提供了更多选择。动态分配是 Spark 的重要特性,能够根据负载自动调整执行器数量,提高资源利用率。

自定义提交机制

引入了 SparkApplicationSubmitter 接口,允许用户自定义提交机制。这一架构上的改进为高级用户提供了更大的灵活性,可以根据特定需求实现自己的提交逻辑,比如集成特定的安全机制或工作流引擎。

证书管理集成

新增了对 cert-manager 的支持,用于自动生成 webhook 证书。这一改进简化了安全配置流程,cert-manager 是 Kubernetes 上广泛使用的证书管理工具,能够自动处理证书的签发和续期,提高了部署的可靠性和安全性。

稳定性与安全性增强

Webhook 证书验证

修复了 webhook 证书的有效性检查问题。这一改进确保了 webhook 通信的安全性,防止使用过期或无效的证书,是保障集群安全运行的重要措施。

测试覆盖提升

版本中修复并添加了多项单元测试,特别是针对 Volcano 集成和驱动/执行器配置的测试。完善的测试覆盖是保证软件质量的关键,这些改进有助于提高系统的稳定性和可靠性。

向后兼容性考虑

v2.2.0 版本中移除了对 v1beta1 API 的支持,这是向更现代化架构演进的一部分。用户如果需要升级,应当确保他们的应用已经迁移到更新的 API 版本。同时,sparkctl 工具已被正式弃用并移除,用户应当使用 kubectl 或其他 Kubernetes 原生工具来管理 Spark 作业。

总结

Kubeflow Spark Operator v2.2.0 版本在功能、安全性和可用性方面都有显著提升。从支持最新 Spark 版本到增强的调度能力,从改进的资源管理到更灵活的自定义选项,这些变化使得在 Kubernetes 上运行 Spark 作业更加高效和可靠。对于正在使用或考虑使用 Spark Operator 的团队,这一版本值得认真评估和升级。

登录后查看全文
热门项目推荐

热门内容推荐

最新内容推荐

项目优选

收起
openHiTLS-examplesopenHiTLS-examples
本仓将为广大高校开发者提供开源实践和创新开发平台,收集和展示openHiTLS示例代码及创新应用,欢迎大家投稿,让全世界看到您的精巧密码实现设计,也让更多人通过您的优秀成果,理解、喜爱上密码技术。
C
47
253
openHiTLSopenHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
347
381
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
871
516
ohos_react_nativeohos_react_native
React Native鸿蒙化仓库
C++
179
263
openGauss-serveropenGauss-server
openGauss kernel ~ openGauss is an open source relational database management system
C++
131
184
kernelkernel
deepin linux kernel
C
22
5
nop-entropynop-entropy
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
7
0
Cangjie-ExamplesCangjie-Examples
本仓将收集和展示高质量的仓颉示例代码,欢迎大家投稿,让全世界看到您的妙趣设计,也让更多人通过您的编码理解和喜爱仓颉语言。
Cangjie
335
1.09 K
harmony-utilsharmony-utils
harmony-utils 一款功能丰富且极易上手的HarmonyOS工具库,借助众多实用工具类,致力于助力开发者迅速构建鸿蒙应用。其封装的工具涵盖了APP、设备、屏幕、授权、通知、线程间通信、弹框、吐司、生物认证、用户首选项、拍照、相册、扫码、文件、日志,异常捕获、字符、字符串、数字、集合、日期、随机、base64、加密、解密、JSON等一系列的功能和操作,能够满足各种不同的开发需求。
ArkTS
31
0
CangjieCommunityCangjieCommunity
为仓颉编程语言开发者打造活跃、开放、高质量的社区环境
Markdown
1.08 K
0