Sealos项目中端口冲突导致Ingress-Nginx控制器异常问题分析

2025-05-14 09:34:39作者：卓艾滢Kingsley

Sealos is an AI-native Cloud Operating System built on Kubernetes that unifies the entire application lifecycle, from development in cloud IDEs to production deployment and management. It is perfect for building and scaling modern AI applications, managed databases (MySQL, PostgreSQL, Redis, MongoDB) and complex microservice architectures.

项目地址：https://gitcode.com/GitHub_Trending/se/sealos

在Sealos云原生操作系统的部署过程中，我们遇到了一个典型的端口冲突问题。当用户尝试将cloud-port参数设置为8443时，系统会出现no endpoints available for service "ingress-nginx-controller-admission"的错误提示，导致Ingress-Nginx控制器无法正常启动。

问题现象

在部署Sealos v5.0.0-beta5版本时，如果指定--cloud-port=8443参数，Ingress-Nginx控制器的Pod会进入反复重启状态。通过检查Pod日志和状态，可以看到控制器不断报告健康检查失败（HTTP probe failed with statuscode: 500），最终导致服务不可用。

根本原因

深入分析后发现，这个问题源于端口冲突。Ingress-Nginx控制器的admission webhook服务默认使用8443端口进行验证通信。当我们将cloud-port也设置为8443时，就产生了端口占用冲突，导致webhook服务无法正常启动和工作。

具体表现为：

Ingress-Nginx的admission webhook服务需要8443端口来接收验证请求
控制器Pod中的--validating-webhook=:8443参数显式指定了这个端口
当cloud服务也尝试绑定8443端口时，系统无法同时满足两个服务的端口需求

解决方案

针对这个问题，我们建议采取以下解决方案：

避免端口冲突：最简单的方法是避免使用8443作为cloud-port，可以选择其他未被占用的端口（如默认的443端口）
修改Ingress-Nginx配置：对于必须使用8443端口的场景，可以通过修改Ingress-Nginx的部署配置来改变其webhook端口：
```
controller:
  admissionWebhooks:
    port: 9443  # 改为其他可用端口
```
检查端口占用情况：在部署前使用netstat -tuln或ss -tuln命令检查目标端口是否已被占用