Kuberay项目中使用kindest/node:v1.24.0运行e2e测试失败问题分析

2025-07-09 09:36:41作者：邓越浪Henry

A toolkit to run Ray applications on Kubernetes

项目地址：https://gitcode.com/GitHub_Trending/ku/kuberay

在Kuberay项目的开发过程中，开发人员发现当使用kindest/node:v1.24.0版本的Kubernetes集群运行ray-operator的端到端测试时，测试用例"TestRayClusterManagedBy"会失败。这个问题在M3(arm)架构的MacOS系统和x86-64架构的Ubuntu系统上都能够复现。

测试失败的具体表现是，在测试"Failed_creation_of_cluster,_managed_by_external_controller"场景时，预期应该发生的错误没有出现，导致测试断言失败。错误日志显示测试执行了panic(nil)或runtime.Goexit。

经过排查，开发人员发现当将Kubernetes版本升级到v1.26.0后，测试能够顺利通过。进一步的测试表明，v1.25.0版本是能够支持当前ray-operator所有端到端测试的最低Kubernetes版本。

这个问题揭示了Kuberay项目对Kubernetes版本有一定的依赖关系。特别是"ManagedBy"功能可能依赖于Kubernetes v1.24.0之后引入的某些特性。这提醒开发者在本地开发环境搭建时需要特别注意Kubernetes版本的选择。

针对这个问题，项目团队建议采取以下措施：

更新开发文档，明确指出运行端到端测试所需的最低Kubernetes版本要求
在持续集成配置中固定Kubernetes版本，确保CI环境和文档描述的一致性
全面评估各组件(ray-operator、kubectl-plugin、apiserver)的Kubernetes版本兼容性，找出能够支持所有组件的最低版本

这个案例也提醒我们，在开发基于Kubernetes的Operator时，需要特别注意Kubernetes版本兼容性问题，特别是在使用较新的Kubernetes特性时。在项目文档中明确标注版本要求，可以避免开发者在使用过程中遇到类似的兼容性问题。

A toolkit to run Ray applications on Kubernetes

项目地址：https://gitcode.com/GitHub_Trending/ku/kuberay

登录后查看全文

项目优选

收起

deepin linux kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

昇腾LLM分布式训练框架

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。