Kubespray项目中Cilium网络插件在分离部署模式下的问题分析

2025-05-13 20:11:08作者：蔡怀权

项目地址：https://gitcode.com/gh_mirrors/kub/kubespray

问题背景

在Kubespray项目的持续集成测试中，发现了一个与Cilium网络插件相关的异常现象。具体表现为在Packet云平台上使用Ubuntu 20.04系统进行分离部署模式（separate mode）测试时，第三个节点（instance-3）未能正确完成所有组件的部署流程。

问题现象

测试执行过程中，系统在完成"检查是否运行在Azure VM"的任务后，后续任务仅在前两个节点（instance-1和instance-2）上执行。这导致instance-3节点上缺少nerdctl等关键组件的安装，最终影响了容器镜像列表查询功能的正常运行。

从日志中可以清晰地看到：

在初始阶段，所有三个节点都参与了"检查Azure VM"的任务
随后任务执行范围缩小到instance-1和instance-2
instance-3节点上的nerdctl安装被跳过
当需要查询容器镜像时，instance-3节点因缺少nerdctl而失败

根本原因

经过深入分析，发现这并非真正的缺陷，而是由测试环境的特定配置导致的预期行为。测试使用了分离部署模式（separate mode），在这种模式下：

instance-3节点被专门配置为仅运行etcd服务
Kubernetes核心组件不会被安装到该节点上
相关容器工具链（如nerdctl）也不需要在该节点部署

这种设计是出于架构分离的考虑，将etcd服务与Kubernetes控制平面组件物理隔离，以提高集群的稳定性和安全性。

解决方案

对于遇到类似问题的开发者，建议采取以下步骤进行验证和解决：

检查测试配置文件中关于部署模式的设置
确认各节点的角色分配是否符合预期
对于专门运行etcd的节点，不需要安装完整的Kubernetes组件
在编写测试用例时，应考虑节点角色的差异性

经验总结

这个案例提醒我们，在使用Kubespray进行Kubernetes部署时，理解不同部署模式的特点至关重要。分离部署模式虽然增加了架构复杂性，但能够提供更好的隔离性和专业性。开发者在遇到类似问题时，应该：

仔细阅读测试配置和部署模式说明
理解各节点在不同模式下的预期行为
区分核心功能问题与特定配置下的预期行为
在修改代码前充分理解现有架构设计意图

通过这次问题分析，我们不仅解决了具体的测试失败问题，还加深了对Kubespray部署架构的理解，为后续的开发和测试工作积累了宝贵经验。

kubespray

项目地址：https://gitcode.com/gh_mirrors/kub/kubespray

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

339

186

agent-studio

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

openGauss kernel ~ openGauss is an open source relational database management system

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.35 K

759