Apache APISIX 使用自签名证书访问 etcd 集群的配置实践
问题背景
在分布式系统中,Apache APISIX 作为高性能 API 网关,通常需要与 etcd 集群协同工作。当 etcd 集群启用了 TLS 加密通信时,APISIX 需要正确配置才能与之建立安全连接。特别是在使用自签名证书的环境中,配置不当会导致 Prometheus 插件无法获取 apisix_etcd_reachable 指标的问题。
核心问题分析
当 APISIX 尝试通过 HTTPS 连接 etcd 集群时,会进行主机名验证(hostname verification)。如果 etcd 服务器证书中的 Subject Alternative Name (SAN) 不包含 APISIX 连接时使用的主机名,就会出现 "certificate host mismatch" 错误。
解决方案详解
1. 正确生成 etcd 服务器证书
在创建 etcd 服务器证书时,必须在证书的 SAN 字段中包含所有 etcd 节点的主机名。这可以通过调整证书签名请求(CSR)文件实现:
{
"hosts": [
"etcd-node-1",
"etcd-node-2",
"etcd-node-3",
"其他必要的主机名或IP地址"
],
"其他证书配置项": "..."
}
关键点:
- 必须包含所有 etcd 节点的主机名
- 如果通过 IP 地址访问,也需要包含相应 IP
- 建议同时包含节点名和 IP 地址以提高兼容性
2. 配置 APISIX 的 etcd TLS 连接
在 APISIX 配置文件中,需要正确设置 etcd 的 TLS 参数,特别是 SNI(Server Name Indication)字段:
deployment:
etcd:
tls:
cert: /pki/client.pem
key: /pki/client-key.pem
sni: etcd-node-1
verify: true
配置说明:
cert和key指定客户端证书和私钥路径sni指定 TLS 握手时发送的服务器名称,必须与证书中的 SAN 匹配verify设置为 true 启用证书验证
3. 证书链完整性
确保 APISIX 能够验证 etcd 服务器证书,需要:
- 将 CA 证书放置在 APISIX 可访问的路径
- 在配置中指定 CA 证书路径:
apisix:
ssl:
ssl_trusted_certificate: /pki/ca.pem
技术原理深入
SNI 的作用
SNI 是 TLS 协议的扩展,允许客户端在握手初期指明要连接的服务器的名称。这对于以下场景特别重要:
- 同一 IP 托管多个 TLS 服务
- 证书验证时需要匹配特定主机名
- 多节点 etcd 集群的 TLS 连接
证书验证流程
当 APISIX 连接 etcd 时:
- 发送 ClientHello 消息,包含 SNI 扩展
- 服务器返回证书链
- 客户端验证:
- 证书是否由信任的 CA 签发
- 证书中的 SAN 是否包含 SNI 指定的主机名
- 证书是否在有效期内
- 验证通过后建立安全连接
最佳实践建议
-
证书管理:
- 为每个环境(开发/测试/生产)使用不同的 CA
- 定期更新证书
- 监控证书到期时间
-
配置验证:
- 使用
etcdctl先验证连接 - 逐步增加验证严格度(先关闭验证,再逐步开启)
- 使用
-
多环境支持:
- 使用配置模板管理不同环境的证书路径
- 考虑使用 Kubernetes Secrets 或类似机制管理证书
-
监控与告警:
- 确保 Prometheus 能够正确采集
apisix_etcd_reachable指标 - 设置适当的告警阈值
- 确保 Prometheus 能够正确采集
总结
正确配置 APISIX 与 TLS 保护的 etcd 集群连接需要关注证书的 SAN 字段和 SNI 配置。通过本文介绍的方法,可以解决 Prometheus 插件无法获取 etcd 可达性指标的问题,同时建立安全的 etcd 连接。在实际生产环境中,建议结合自动化工具管理证书生命周期,并建立完善的监控机制。
ERNIE-4.5-VL-28B-A3B-ThinkingERNIE-4.5-VL-28B-A3B-Thinking 是 ERNIE-4.5-VL-28B-A3B 架构的重大升级,通过中期大规模视觉-语言推理数据训练,显著提升了模型的表征能力和模态对齐,实现了多模态推理能力的突破性飞跃Python00
Kimi-K2-ThinkingKimi K2 Thinking 是最新、性能最强的开源思维模型。从 Kimi K2 开始,我们将其打造为能够逐步推理并动态调用工具的思维智能体。通过显著提升多步推理深度,并在 200–300 次连续调用中保持稳定的工具使用能力,它在 Humanity's Last Exam (HLE)、BrowseComp 等基准测试中树立了新的技术标杆。同时,K2 Thinking 是原生 INT4 量化模型,具备 256k 上下文窗口,实现了推理延迟和 GPU 内存占用的无损降低。Python00
MiniMax-M2MiniMax-M2是MiniMaxAI开源的高效MoE模型,2300亿总参数中仅激活100亿,却在编码和智能体任务上表现卓越。它支持多文件编辑、终端操作和复杂工具链调用Python00
Spark-Prover-7BSpark-Prover 是由科大讯飞团队开发的专用大型语言模型,专为 Lean4 中的自动定理证明而设计。该模型采用创新的三阶段训练策略,显著增强了形式化推理能力,在同等规模的开源模型中实现了最先进的性能。Python00
MiniCPM-V-4_5MiniCPM-V 4.5 是 MiniCPM-V 系列中最新且功能最强的模型。该模型基于 Qwen3-8B 和 SigLIP2-400M 构建,总参数量为 80 亿。与之前的 MiniCPM-V 和 MiniCPM-o 模型相比,它在性能上有显著提升,并引入了新的实用功能Python00
Spark-Formalizer-7BSpark-Formalizer 是由科大讯飞团队开发的专用大型语言模型,专注于数学自动形式化任务。该模型擅长将自然语言数学问题转化为精确的 Lean4 形式化语句,在形式化语句生成方面达到了业界领先水平。Python00
GOT-OCR-2.0-hf阶跃星辰StepFun推出的GOT-OCR-2.0-hf是一款强大的多语言OCR开源模型,支持从普通文档到复杂场景的文字识别。它能精准处理表格、图表、数学公式、几何图形甚至乐谱等特殊内容,输出结果可通过第三方工具渲染成多种格式。模型支持1024×1024高分辨率输入,具备多页批量处理、动态分块识别和交互式区域选择等创新功能,用户可通过坐标或颜色指定识别区域。基于Apache 2.0协议开源,提供Hugging Face演示和完整代码,适用于学术研究到工业应用的广泛场景,为OCR领域带来突破性解决方案。00