首页
/ Kubernetes kubeadm 集群从堆叠式 etcd 迁移到外部 etcd 的技术方案

Kubernetes kubeadm 集群从堆叠式 etcd 迁移到外部 etcd 的技术方案

2025-06-18 18:37:24作者:盛欣凯Ernestine

在 Kubernetes 生产环境中,随着集群规模的扩大,将 etcd 从堆叠式(stacked)架构迁移到外部独立集群是常见的优化需求。本文将详细介绍在 Kubernetes v1.30.2 版本中使用 kubeadm 部署的集群如何完成这一关键架构变更。

迁移背景与挑战

堆叠式 etcd 架构中,etcd 实例与 Kubernetes 控制平面组件(如 API Server)共同部署在同一节点上。这种架构虽然部署简单,但随着集群规模增长会面临以下问题:

  1. 资源竞争:etcd 与控制平面组件共享节点资源
  2. 扩展性限制:etcd 集群规模受限于控制平面节点数量
  3. 维护复杂性:升级或维护 etcd 会影响控制平面可用性

迁移到外部 etcd 集群可以解决这些问题,但需要确保迁移过程中不丢失关键数据,保持集群服务的连续性。

迁移前准备

环境检查

  1. 确认当前 Kubernetes 版本为 v1.30.2
  2. 检查 etcd 数据健康状态
  3. 准备与现有集群 etcd 版本兼容的外部 etcd 集群

资源准备

  1. 准备至少3个专用节点用于外部 etcd 集群
  2. 确保网络连通性:控制平面节点可访问新 etcd 节点
  3. 准备足够的存储空间存放 etcd 数据快照

详细迁移步骤

第一步:创建 etcd 数据快照

在任一控制平面节点执行:

# 获取当前 etcd Pod 名称
ETCD_POD=$(kubectl get pods -n kube-system | grep etcd | awk '{print $1}')

# 创建 etcd 快照
kubectl exec -n kube-system $ETCD_POD -- \
  etcdctl --endpoints=https://127.0.0.1:2379 \
  --cacert=/etc/kubernetes/pki/etcd/ca.crt \
  --cert=/etc/kubernetes/pki/etcd/server.crt \
  --key=/etc/kubernetes/pki/etcd/server.key \
  snapshot save /var/lib/etcd/snapshot.db

第二步:部署外部 etcd 集群

  1. 在新节点上安装与当前版本兼容的 etcd
  2. 使用快照文件初始化新 etcd 集群
  3. 验证新集群数据完整性和成员健康状态

第三步:修改 kubeadm 配置

编辑 kube-system 命名空间中的 kubeadm-config ConfigMap:

kubectl edit cm kubeadm-config -n kube-system

更新 etcd 配置部分,替换为外部 etcd 集群的连接信息。

第四步:更新控制平面组件

  1. 逐个停止控制平面节点的 kubelet 服务
  2. 修改 /etc/kubernetes/manifests/kube-apiserver.yaml 文件,更新 etcd 服务端点
  3. 移除本地 etcd 的静态 Pod 清单文件
  4. 重启 kubelet 服务

第五步:验证迁移结果

  1. 检查所有控制平面组件状态
  2. 验证 API Server 与新 etcd 集群的连接
  3. 测试集群基本功能(部署应用、扩缩容等)

迁移后检查清单

  1. 确认所有控制平面组件处于健康状态
  2. 验证 etcd 集群成员列表和领导状态
  3. 检查核心 Kubernetes 资源(如 Nodes、Pods)是否可正常访问
  4. 监控系统关键指标(API 延迟、etcd 存储增长等)

风险缓解措施

  1. 在非生产环境充分测试迁移流程
  2. 准备完整的回滚方案(包括 etcd 快照和控制平面备份)
  3. 选择业务低峰期执行迁移操作
  4. 考虑分阶段迁移(如先迁移部分控制平面节点)

通过以上严谨的步骤,可以安全地将 kubeadm 管理的 Kubernetes 集群从堆叠式 etcd 架构迁移到外部独立部署的 etcd 集群,同时保持服务的连续性和数据的完整性。

登录后查看全文
热门项目推荐

热门内容推荐

最新内容推荐

项目优选

收起
kernelkernel
deepin linux kernel
C
22
6
docsdocs
OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
154
1.98 K
nop-entropynop-entropy
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
8
0
HarmonyOS-ExamplesHarmonyOS-Examples
本仓将收集和展示仓颉鸿蒙应用示例代码,欢迎大家投稿,在仓颉鸿蒙社区展现你的妙趣设计!
Cangjie
405
387
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
941
555
金融AI编程实战金融AI编程实战
为非计算机科班出身 (例如财经类高校金融学院) 同学量身定制,新手友好,让学生以亲身实践开源开发的方式,学会使用计算机自动化自己的科研/创新工作。案例以量化投资为主线,涉及 Bash、Python、SQL、BI、AI 等全技术栈,培养面向未来的数智化人才 (如数据工程师、数据分析师、数据科学家、数据决策者、量化投资人)。
Python
75
70
openHiTLSopenHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
992
395
ops-mathops-math
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
509
44
Cangjie-ExamplesCangjie-Examples
本仓将收集和展示高质量的仓颉示例代码,欢迎大家投稿,让全世界看到您的妙趣设计,也让更多人通过您的编码理解和喜爱仓颉语言。
Cangjie
344
1.32 K
ohos_react_nativeohos_react_native
React Native鸿蒙化仓库
C++
194
279