Submariner项目中Calico VXLAN模式对跨集群通信的影响分析

2025-06-30 15:30:21作者：仰钰奇

Submariner是一个开源的跨云网络连接解决方案，用于实现多个Kubernetes集群之间的网络连接。 - 功能：Kubernetes集群连接；跨云网络连接。 - 特点：易于使用；支持多种云供应商；与Kubernetes集成；实现网络连接高可用性。

项目地址：https://gitcode.com/gh_mirrors/su/submariner

背景介绍

在Kubernetes多集群环境中，Submariner是一个常用的跨集群网络解决方案。当与Calico CNI插件结合使用时，网络工程师们经常会遇到一些特定的配置挑战。本文重点分析在Submariner环境下，Calico使用VXLAN封装模式时对跨集群通信性能的影响。

问题现象

在Submariner 0.18.0版本与Kubernetes 1.25.3环境中，当Calico配置为VXLAN模式时，用户观察到以下现象：

非网关节点上的Pod之间跨集群通信失败
网关节点的路由表中出现"unreachable"路由条目
网络性能显著下降，带宽测试显示吞吐量降低约2/3

技术分析

跨集群通信数据路径

Submariner的跨集群通信数据路径可分为以下几个关键阶段：

出口阶段1：源Pod（非网关节点）→ 源集群网关节点（通过vx-submariner）
出口阶段2：源集群网关节点 → 目标集群网关节点（通过IPSec隧道）
入口阶段1：IPSec数据包解密
入口阶段2：Calico将数据包转发至目标Pod
返回路径：类似过程反向进行

VXLAN模式的影响

Calico的VXLAN模式配置会显著影响跨集群通信：

CrossSubnet模式：
- 仅在跨子网通信时使用VXLAN封装
- 性能接近裸机网络
- 源IP保持为Pod IP
Always模式：
- 所有通信都使用VXLAN封装
- 性能下降明显
- 源IP变为网关节点IP

路由表分析

在网关节点上，Submariner会创建特定的路由表（table 150）来处理跨集群通信：

10.96.0.0/16 dev ens192 proto static scope link src 10.202.44.192 
10.244.0.0/16 dev ens192 proto static scope link src 10.202.44.192

这些路由确保了跨集群流量能够正确转发。

性能对比测试

通过iperf3进行的带宽测试显示了不同配置下的性能差异：

节点间直接通信：
- 吞吐量：约1GB/s
Pod间通信（CrossSubnet模式）：
- 吞吐量：约950MB/s
- 接近裸机性能
Pod间通信（Always模式）：
- 吞吐量：约200MB/s
- 性能下降约2/3

解决方案与建议

网络策略调整：
- 确保FORWARD链的默认策略为ACCEPT
- 或添加明确的规则允许跨集群流量
Calico配置选择：
- 在安全环境允许的情况下，优先使用CrossSubnet模式
- 仅在需要严格安全控制时使用Always模式
路由验证：
- 定期检查网关节点的路由表（特别是table 150）
- 确认跨集群CIDR路由正确配置
组件重启：
- 必要时重启Submariner RouteAgent组件
- 命令：kubectl delete pods -n submariner-operator -l app=submariner-routeagent

最佳实践

在生产环境部署前，务必进行全面的性能测试
根据实际安全需求选择合适的Calico封装模式
监控跨集群通信的延迟和吞吐量指标
定期检查Submariner各组件的日志和状态

总结

Submariner与Calico的集成提供了强大的跨集群通信能力，但需要仔细配置以获得最佳性能。理解数据路径和不同封装模式的影响，对于设计和维护高效的Kubernetes多集群网络至关重要。通过合理的配置和持续的监控，可以在安全性和性能之间取得良好平衡。

Submariner是一个开源的跨云网络连接解决方案，用于实现多个Kubernetes集群之间的网络连接。 - 功能：Kubernetes集群连接；跨云网络连接。 - 特点：易于使用；支持多种云供应商；与Kubernetes集成；实现网络连接高可用性。

项目地址：https://gitcode.com/gh_mirrors/su/submariner

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

flutter_flutter

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Ascend Extension for PyTorch

ohos_react_native

React Native鸿蒙化仓库