Kubespray项目中Cilium网络插件kube-proxy替换配置的升级指南

2025-05-13 02:25:40作者：苗圣禹Peter

在Kubernetes集群部署工具Kubespray中，当使用Cilium作为网络插件时，近期发现了一个重要的配置变更问题。这个问题源于Cilium v1.16版本对kube-proxy替换机制的参数进行了重大调整，导致使用旧配置的集群无法正常启动。

问题背景

Cilium作为CNI网络插件，从早期版本开始就提供了kube-proxy替换功能，允许用户通过不同的模式来替代传统的kube-proxy组件。在v1.16之前的版本中，这个功能通过--kube-proxy-replacement参数配置，支持三个选项值：

strict：完全替换kube-proxy
partial：部分替换kube-proxy
disabled：禁用替换功能

然而，从2023年1月开始，Cilium项目就宣布将逐步废弃这种多选项的配置方式，转而采用更简单的布尔值(true/false)配置。这一变更最终在2024年3月发布的v1.16.0版本中正式实施。

变更影响

当用户尝试在Kubespray中使用Cilium v1.16或更高版本时，如果仍然配置了旧的参数值（如strict/partial/disabled），Cilium守护进程会立即崩溃并进入CrashLoopBackOff状态。查看日志会发现如下错误信息：

level=fatal msg="failed to start: daemon creation failed: unable to initialize kube-proxy replacement options: Invalid value for --kube-proxy-replacement: partial
failed to stop: unable to find controller ipcache-inject-labels" subsys=daemon

这个错误明确表明系统不再接受partial等旧参数值，必须更新为新的布尔值配置。

配置迁移方案

为了适配Cilium v1.16+版本，用户需要对Kubespray中的相关配置进行如下调整：

将原先的strict值改为true
将原先的partial或disabled值改为false

具体到Kubespray项目中的配置文件，需要修改以下位置：

主配置文件中的cilium_kube_proxy_replacement参数
Cilium的ConfigMap模板
Cilium的DaemonSet部署模板
Cilium Operator的部署模板
测试用例文件中的相关配置

技术实现细节

在新的实现中，Cilium简化了kube-proxy替换功能的配置逻辑：

当设置为true时，Cilium会完全接管kube-proxy的功能，包括服务IP的负载均衡、NodePort服务等
当设置为false时，Cilium将不会替换kube-proxy，集群需要继续运行传统的kube-proxy组件

这种布尔值的配置方式更加直观，也减少了用户的选择困惑。从技术实现角度看，Cilium内部已经统一了处理逻辑，不再需要维护多种替换模式的不同代码路径。

升级注意事项

由于这是一个破坏性变更，用户在升级时需要注意：

在升级Cilium版本前，务必先更新Kubespray中的相关配置
检查所有自定义配置中是否包含旧的kube-proxy替换参数
更新相关文档和自动化脚本
在测试环境中验证配置变更后的集群行为

对于生产环境，建议先在测试集群上验证新配置，确保所有服务在Cilium的新模式下正常工作，特别是那些依赖kube-proxy功能的组件。

总结

Cilium项目对kube-proxy替换配置的简化是一个积极的改进，虽然带来了短期的升级挑战，但从长期来看降低了配置复杂度，提高了系统的可维护性。Kubespray用户应当及时跟进这一变更，更新自己的集群配置，以确保能够顺利使用Cilium的最新功能和安全更新。

登录后查看全文

项目优选

收起

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

468

461

pytorch

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。

Python

1.03 K

644