Eclipse Che 中 Kubernetes 命名空间预配性能问题分析与优化

2025-05-30 20:06:11作者：余洋婵Anita

Kubernetes based Cloud Development Environments for Enterprise Teams

项目地址：https://gitcode.com/gh_mirrors/ch/che

问题背景

在 Eclipse Che 7.99 最新版本中，用户报告了一个关于 Kubernetes 命名空间预配的性能问题。具体表现为在某些 OpenShift 集群上，执行 POST /kubernetes/namespace/provision 请求可能需要长达 20-30 秒的时间，这导致用户仪表板出现错误并显示加载失败。

问题现象

当用户在特定环境（如 Amazon 上的 OpenShift 集群）中执行命名空间预配操作时，会遇到以下情况：

GET /kubernetes/namespace/provision 请求响应迅速
POST /kubernetes/namespace/provision 请求却需要 20-30 秒才能完成
由于响应时间过长，用户仪表板会出现错误提示和加载失败

技术分析

通过深入分析，我们发现问题的根源在于命名空间预配过程中频繁的 Kubernetes API 调用。具体表现为：

在 POST 操作期间，系统会多次执行相同的 Kubernetes API 请求
关键请求 GET /api/v1/namespaces 会被重复调用多达 13 次
当集群响应变慢时，这些重复请求的累积时间会超过仪表板的默认超时设置

根本原因

经过技术调查，我们确定了几个关键因素：

重复请求问题：命名空间预配逻辑中存在不必要的重复 API 调用，特别是在检查命名空间状态时
超时设置不合理：仪表板前端对 API 调用的超时设置是硬编码的（当前为 20 秒），无法适应不同集群环境
集群性能差异：在某些负载较高的 OpenShift 集群上，Kubernetes API 响应时间会显著增加

解决方案

针对上述问题，我们制定了以下优化方案：

减少重复 API 调用：
- 优化命名空间预配逻辑，减少对相同 API 端点的重复调用
- 实现本地缓存机制，避免不必要的集群查询
可配置的超时设置：
- 将仪表板的 API 超时设置从硬编码改为通过 CRD 可配置
- 允许管理员根据集群性能调整超时阈值
性能监控与日志：
- 启用 TRACE 级别日志记录，帮助诊断 API 调用性能问题
- 添加详细的请求计时信息，便于性能分析

实施建议

对于遇到此问题的用户，我们建议采取以下临时解决方案：

在 che-server 配置中启用 TRACE 日志级别，帮助诊断具体性能瓶颈
对于性能较差的集群，考虑增加仪表板的超时设置
监控 Kubernetes API 服务器的性能指标，排查集群层面的性能问题

未来改进方向

长期来看，我们将考虑以下改进：

实现更智能的 API 调用策略，根据集群性能动态调整
优化命名空间预配流程，减少对 Kubernetes API 的依赖
增强仪表板的错误处理机制，提供更友好的超时提示和重试功能

通过以上优化，我们期望能够显著改善 Eclipse Che 在各类 Kubernetes 环境中的命名空间预配性能，为用户提供更稳定可靠的使用体验。

Kubernetes based Cloud Development Environments for Enterprise Teams

项目地址：https://gitcode.com/gh_mirrors/ch/che

登录后查看全文

热门内容推荐

1 编程实践项目探索指南：从零构建技术能力体系 2 技术解构式学习：从0到1构建你的编程知识体系 3 构建自己的技术世界：build-your-own-x项目的实践探索指南 4 解锁编程技能的实践之旅：从零构建你的技术世界 5 技术实践探索：从零开始构建核心系统的实践指南 6 亲手锻造技术引擎：从0到1构建核心系统的实践指南

最新内容推荐

AcFunDown视频下载工具完全指南还在为数字笔记抓狂？这款开源神器让手写批注效率提升300%Windows笔记本电池健康管理全指南：从根源解决电池损耗问题 gmx_MMPBSA分子间相互作用索引错误的深度诊断与解决 Axure RP 11 本地化方案：Mac中文界面优化与原型设计工具汉化全指南如何高效获取教育资源？这款工具让教材下载效率提升80%视频元数据深度编辑：专业技巧与案例网盘直链下载技术解析与应用指南如何用DeepSeek-R1推理模型提升复杂任务解决能力：完整指南 5个突破瓶颈技巧：硬件优化工具让你的电脑性能提升30%

项目优选

收起

deepin linux kernel

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

cann-learning-hub

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。

Jupyter Notebook

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。