Kubespray部署多主集群时外部负载均衡器配置问题解析

2025-05-13 11:52:02作者：俞予舒Fleming

项目地址：https://gitcode.com/gh_mirrors/kub/kubespray

在使用Kubespray部署Kubernetes多主高可用集群时，配置外部负载均衡器(如Azure NLB)是一个关键步骤。本文深入分析一个典型配置问题及其解决方案。

问题现象

用户在RHEL 9系统上使用Kubespray最新版本部署多主集群时，指定了外部负载均衡器地址(10.0.1.60:8443)，但kubeadm初始化阶段报错显示多个端口(6443、10259等)被占用，同时提示各类manifest文件已存在。

根本原因

深入分析发现，这些表面错误实际上掩盖了真正的连接问题。当Kubespray尝试通过配置的外部LB地址进行集群初始化时，由于网络连通性问题导致LB不可达，系统错误地回退到本地端口检测，误判为端口冲突。

技术细节

负载均衡器配置参数：
- apiserver_loadbalancer_domain_name：LB的域名或IP
- loadbalancer_apiserver.address/port：LB的具体地址和端口
- loadbalancer_apiserver_localhost：强制禁用本地回退
初始化流程： Kubespray会优先尝试通过配置的LB地址建立连接，若失败则会：
- 检查本地端口占用情况
- 验证manifest文件是否存在
- 这些本应是备用的检测机制却成为了主要报错来源

解决方案

分阶段部署策略：
- 先完成基础集群部署（不配置LB）
- 验证基础集群健康状态
- 添加LB配置后执行滚动更新

网络连通性验证：

# 从所有控制节点测试LB连通性
curl -vk https://10.0.1.60:8443
telnet 10.0.1.60 8443

配置建议：

loadbalancer_apiserver:
  address: 10.0.1.60
  port: 8443
loadbalancer_apiserver_localhost: false  # 禁用本地回退

经验总结

外部LB配置问题常表现为其他表面错误，需透过现象看本质
分阶段部署是复杂环境下的可靠策略
网络连通性验证应作为部署前的标准检查项
Kubespray的错误处理机制有时会掩盖真实问题，需要结合日志深度分析

对于生产环境部署，建议在测试环境中预先验证LB配置，确保网络策略允许控制节点与LB之间的双向通信，这将显著提高部署成功率。

kubespray

项目地址：https://gitcode.com/gh_mirrors/kub/kubespray

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

leetcode

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Ascend Extension for PyTorch