Amazon VPC CNI插件中MAC地址策略变更导致的网络中断问题分析

2025-07-02 11:43:27作者：蔡丛锟

amazon-vpc-cni-k8s

Networking plugin repository for pod networking in Kubernetes using Elastic Network Interfaces on AWS

项目地址：https://gitcode.com/gh_mirrors/am/amazon-vpc-cni-k8s

问题背景

在Kubernetes集群中使用Amazon VPC CNI插件时，Ubuntu 22.04系统上出现了一个特殊的网络问题。用户报告称，在Pod网络连接中出现了周期性的中断现象。经过排查发现，这与系统网络接口的MAC地址策略变更有关。

问题现象

用户在Ubuntu 22.04系统上部署Kubernetes集群时，预先配置了/usr/lib/systemd/network/99-default.link文件，将MACAddressPolicy设置为none。然而在实际运行中，该配置会被自动修改为persistent，导致网络连接问题。值得注意的是，尽管文件内容被修改，但文件的时间戳仍保持为原始时间（2022年）。

技术原理分析

systemd-udev的作用： Ubuntu 22.04系统默认安装的systemd-udev包会创建并管理99-default.link文件。该文件中的MACAddressPolicy=persistent设置会导致主机veth接口的MAC地址在移动到主机网络命名空间后发生变化。
CNI插件的工作机制： Amazon VPC CNI插件会在Pod网络命名空间中为默认网关安装静态ARP绑定，指向主机veth接口的MAC地址。当MAC地址因策略变更而改变时，会导致Pod的网络连接中断。
Ubuntu系统的特殊性：这个问题在Ubuntu 22.04及更高版本中表现尤为明显，可能与系统默认的网络配置策略有关。

解决方案

临时解决方案：手动修改99-default.link文件，将MACAddressPolicy设置为none。这可以防止MAC地址的意外变更，保持网络连接的稳定性。
长期解决方案：目前Amazon VPC CNI团队正在评估长期解决方案。建议关注官方更新，以获得更持久的修复方案。

最佳实践建议

对于使用Ubuntu 22.04作为Kubernetes节点操作系统的用户，建议在系统初始化时就配置好MACAddressPolicy=none。
在生产环境中部署前，应该进行充分的网络稳定性测试，特别是长时间运行的测试，以验证配置的持久性。
考虑使用配置管理工具（如Ansible、Chef等）来确保系统配置的一致性，防止配置被意外修改。

总结

这个问题展示了底层系统配置与Kubernetes网络插件交互时可能出现的复杂情况。理解systemd网络配置与CNI插件的工作原理对于诊断和解决这类网络问题至关重要。虽然目前有临时解决方案，但用户应该关注官方的长期解决方案，以获得更稳定可靠的网络体验。

amazon-vpc-cni-k8s

Networking plugin repository for pod networking in Kubernetes using Elastic Network Interfaces on AWS

项目地址：https://gitcode.com/gh_mirrors/am/amazon-vpc-cni-k8s

登录后查看全文

项目优选

收起

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

昇腾LLM分布式训练框架

flutter_flutter

TorchAir 支持用户基于PyTorch框架和torch_npu插件在昇腾NPU上使用图模式进行推理。

ohos_react_native

React Native鸿蒙化仓库