cert-manager中HTTP-01挑战失败问题分析与解决

2025-05-18 22:23:09作者：郜逊炳

问题现象

在使用cert-manager进行Let's Encrypt证书签发时，用户遇到了HTTP-01挑战失败的问题。具体表现为：

生产环境证书申请失败，但测试环境(staging)可以正常工作
错误日志显示cert-manager在尝试访问挑战URL时，意外地转向了8443端口
虽然外部curl请求可以正常访问挑战URL，但cert-manager内部的自我检查失败

问题分析

从日志和用户提供的配置信息可以看出几个关键点：

端口重定向问题：cert-manager在尝试访问HTTP挑战URL时，系统自动将请求重定向到了HTTPS的8443端口。这通常是由于Ingress控制器配置了强制HTTPS重定向导致的。
网络策略影响：用户使用了Cilium网络策略，虽然已经开放了必要的端口(80、443、8089、8443)，但HTTPS重定向行为干扰了正常的HTTP挑战流程。
自我检查机制：cert-manager会在内部执行自我检查，验证挑战URL是否可访问。当这个检查失败时，即使外部访问正常，证书申请也会失败。

解决方案

针对这个问题，有以下几种解决方法：

方案一：禁用Ingress的SSL重定向

在Ingress资源中添加注解，明确禁用SSL重定向：

metadata:
  annotations:
    haproxy.org/ssl-redirect: "false"

方案二：调整网络策略

确保网络策略不会阻止cert-manager对挑战URL的访问：

确认所有相关端口(80、8089)都已开放
检查是否有其他网络策略可能干扰流量

方案三：使用Ingress类特定配置

根据使用的Ingress控制器不同，可能需要特定的配置方式：

对于Nginx Ingress: nginx.ingress.kubernetes.io/ssl-redirect: "false"
对于Traefik: 需要配置相应的中间件

深入理解

HTTP-01挑战的工作原理是：

cert-manager创建一个临时的Pod来处理ACME挑战请求
这个Pod监听8089端口，通过Service暴露
Ingress控制器将.well-known/acme-challenge路径的流量路由到这个Service
Let's Encrypt服务器会从外部访问这个URL进行验证

当系统强制将HTTP流量重定向到HTTPS时，会破坏这个验证流程，因为：

Let's Encrypt的验证服务器只使用HTTP协议
重定向会导致验证失败
cert-manager的自我检查也会受到影响

最佳实践

为了避免这类问题，建议：

在测试环境充分验证证书申请流程
明确区分生产环境和测试环境的配置差异
监控cert-manager的日志，及时发现潜在问题
了解使用的Ingress控制器的具体行为

通过理解这些底层机制，可以更有效地排查和解决cert-manager证书申请过程中的各种问题。

cert-manager

项目地址：https://gitcode.com/gh_mirrors/ce/cert-manager

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

TSX

1.13 K

271