Kube-Router网络策略中双栈IPSet的Bug分析与修复

2025-07-02 12:44:20作者：蔡丛锟

在Kube-Router项目中发现了一个关于网络策略IPSet处理的Bug，该Bug主要影响双栈（IPv4/IPv6）环境下的网络策略实现。本文将深入分析这个Bug的成因、影响以及修复方案。

问题背景

Kube-Router使用两个独立的ipsetHandler分别处理IPv4和IPv6协议：

nsc.ipSetHandlers[v1.IPv4Protocol]
nsc.ipSetHandlers[v1.IPv6Protocol]

理论上，这两个处理器应该各自管理对应IP家族的IPSet集合。然而在实际实现中，两个处理器都同时跟踪了两种IP家族的IPSet，这导致了IPSet恢复时出现数据不一致的问题。

Bug详细分析

当Kube-Router执行IPSet恢复操作时，会先后调用两个ipsetHandler的恢复方法。由于两个处理器都处理相同的IPSet集合，最终生效的是后执行的IPv6处理器的数据。更严重的是，IPv6处理器在处理IPv4 IPSet时使用了错误的IP地址。

具体表现为：

初始部署时，IPv4和IPv6 IPSet都包含正确的服务器IP
当服务器Pod被删除并重新创建后
IPv6 IPSet保持正确，但IPv4 IPSet要么为空，要么保留了旧的IP地址
导致客户端无法通过服务名称访问新创建的Pod

问题根源

通过日志分析可以清楚地看到问题所在。IPv6处理器在恢复IPv4 IPSet时使用了旧的IPv4地址（如10.42.1.6），而正确的应该是新的IPv4地址（如10.42.1.7）。这表明IPSet处理逻辑中存在IP家族隔离不彻底的问题。

修复方案

修复的核心思想是确保每个ipsetHandler只处理对应IP家族的IPSet集合。具体包括：

严格分离IPv4和IPv6处理器的职责范围
确保IPv4处理器只处理IPv4 IPSet
确保IPv6处理器只处理IPv6 IPSet
避免IPSet集合被重复处理

验证与测试

修复后，通过以下步骤验证功能正常：

部署客户端、服务端、服务和网络策略
验证客户端可以通过服务名称访问服务端
检查IPSet确认包含正确的IPv4和IPv6地址
删除并重新创建服务端Pod
确认客户端仍能正常访问，且IPSet更新为新的IP地址

总结

这个Bug揭示了在双栈环境下网络策略实现时需要特别注意IP家族的严格隔离。Kube-Router的修复确保了网络策略在IPv4/IPv6双栈环境中的正确实现，为生产环境提供了更可靠的网络策略保障。对于使用Kube-Router的用户，建议及时更新到包含此修复的版本，以确保网络策略功能的稳定性。

kube-router

Kube-router, a turnkey solution for Kubernetes networking.

项目地址：https://gitcode.com/gh_mirrors/ku/kube-router

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

nop-entropy

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

349

200

pytorch

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理