OpenBao中Raft TLS配置创建跳过问题的分析与解决

2025-06-19 02:24:28作者：管翌锬

问题现象

在OpenBao 2.1.1版本的运行过程中，系统日志中会周期性地出现"core.raft: skipping new raft TLS config creation, keys are pending"的警告信息。这一现象在单节点部署环境下尤为明显，警告信息以大约5分钟为间隔重复出现。

技术背景

OpenBao使用Raft共识算法来实现高可用性(HA)存储后端。Raft协议要求集群成员之间建立安全的通信通道，因此需要使用TLS进行加密和认证。在OpenBao的实现中，系统会定期轮换Raft通信使用的TLS证书和密钥，以增强安全性。

问题分析

通过查看OpenBao的源代码可以发现，这个问题源于raft.go文件中的TLS配置处理逻辑。系统设计上，当检测到当前有密钥轮换操作正在进行时("keys are pending")，会跳过新TLS配置的创建过程，并记录警告日志。

在正常情况下，这种跳过机制是合理的，可以防止并发操作导致的问题。但在实际运行中，系统似乎进入了某种状态循环：定期尝试创建新配置，但每次都发现密钥轮换仍在进行，于是不断产生警告日志。

根本原因

深入分析表明，这个问题与OpenBao的密钥轮换周期和TLS配置更新机制之间的协调有关。系统默认的密钥轮换间隔较长，而TLS配置检查的频率相对较高，导致在两次密钥轮换之间的时间段内，系统会多次检测到"keys are pending"状态。

解决方案

开发团队已经通过代码提交修复了这个问题。主要修改包括：

优化了TLS配置创建的触发条件判断逻辑
调整了密钥轮换状态的管理机制
改进了日志记录级别，避免产生过多的警告信息

修复后的版本中，系统能够更准确地判断何时需要创建新的TLS配置，同时减少了不必要的警告日志输出。

影响评估

这个问题本质上是一个日志噪声问题，不会影响OpenBao的核心功能或安全性。系统仍能正常处理所有Raft通信和安全操作，只是会产生多余的警告日志。对于依赖日志监控的系统，这些多余的警告可能会干扰对真实问题的判断。

最佳实践

对于使用OpenBao的管理员，建议：

关注OpenBao的版本更新，及时升级到包含此修复的版本
在单节点部署环境下，可以适当调整日志级别以减少非关键警告
在多节点集群中，确保所有节点使用相同版本的OpenBao，以避免潜在的兼容性问题

通过这次问题的分析和解决，OpenBao在Raft TLS配置管理方面的健壮性得到了进一步提升，为分布式环境下的安全通信提供了更可靠的保障。

openbao

OpenBao is a software solution to manage, store, and distribute sensitive data including secrets, certificates, and keys.

项目地址：https://gitcode.com/gh_mirrors/op/openbao

登录后查看全文

项目优选

收起

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本仓将收集和展示高质量的仓颉示例代码，欢迎大家投稿，让全世界看到您的妙趣设计，也让更多人通过您的编码理解和喜爱仓颉语言。

830

6.18 K

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

AtomGit CLI （ag cli），AtomGit 命令行工具，参考 GitHub CLI (gh) 开发。目前 atomgit-cli 项目已在 AtomCode 的 Coding Plan 项目列表中

cann-learning-hub

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。