Harvester项目中使用自定义CA证书导致节点加入失败的解决方案

2025-06-14 17:22:19作者：秋阔奎Evelyn

问题背景

在Harvester v1.4.0版本中，当管理员配置了自定义CA证书后，尝试向集群添加额外节点时会出现加入失败的情况。这一问题主要源于Rancher v2.9.x版本引入的严格TLS验证机制与Harvester现有证书管理机制之间的不兼容性。

技术原理分析

Harvester作为基于Rancher的轻量级超融合基础设施(HCI)解决方案，其节点加入过程依赖于Rancher System Agent组件。在v1.4.0版本中，该组件默认启用了严格TLS验证模式(CATTLE_AGENT_STRICT_VERIFY=true)，导致以下问题链：

主节点配置自定义CA证书后，会将这些证书正确安装到系统证书存储中
但在生成节点加入配置时，rancher2_connection_info.json文件中仍包含默认的"dynamiclistener" CA证书
加入节点尝试连接时，由于严格验证模式，会拒绝使用系统证书存储中的证书，而强制使用连接信息中指定的证书
最终导致TLS握手失败，错误信息为"x509: certificate signed by unknown authority"

解决方案详解

临时解决方案

对于已经部署的环境，可以通过以下步骤临时解决问题：

登录已部署的主节点
修改agent-tls-mode设置为"system-store"
执行kubectl命令更新设置：

kubectl patch settings.management.cattle.io agent-tls-mode --type merge -p '{"value":"system-store"}'

根本解决方案

Harvester团队已在后续版本中修复此问题，具体措施包括：

默认将agent-tls-mode设置为"system-store"
确保节点加入流程正确识别和使用系统证书存储中的自定义CA证书
优化证书传递机制，保证加入节点能获取正确的CA证书链

版本影响范围

受影响版本：Harvester v1.4.0至v1.4.1
已修复版本：v1.4.2及后续版本
不涉及版本：v1.3.x系列（因使用旧版Rancher未引入此机制）

最佳实践建议

对于生产环境部署，建议：

直接使用v1.4.2或更高版本
如需使用v1.4.0/1.4.1，应在部署主节点后立即修改agent-tls-mode设置
确保证书配置包含管理VIP的SAN(Subject Alternative Name)条目
定期检查系统证书存储状态，确保证书链完整

技术深度解析

该问题的本质是Kubernetes集群组件间证书信任链的建立机制。在严格模式下，Rancher System Agent仅信任显式提供的CA证书，而忽略系统证书存储。修复方案通过以下方式确保兼容性：

保留严格验证的安全优势
同时允许系统证书存储作为可信源
维持向后兼容性，不影响现有部署

这种设计既保证了安全性，又提供了部署灵活性，是云原生基础设施证书管理的典型实践。

harvester

Open source hyperconverged infrastructure (HCI) software

项目地址：https://gitcode.com/gh_mirrors/ha/harvester

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

leetcode

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.37 K

781