首页
/ Kubernetes kubeadm 集群从堆叠式 etcd 迁移到外部 etcd 的技术方案

Kubernetes kubeadm 集群从堆叠式 etcd 迁移到外部 etcd 的技术方案

2025-06-18 14:04:45作者:盛欣凯Ernestine

在 Kubernetes 生产环境中,随着集群规模的扩大,将 etcd 从堆叠式(stacked)架构迁移到外部独立集群是常见的优化需求。本文将详细介绍在 Kubernetes v1.30.2 版本中使用 kubeadm 部署的集群如何完成这一关键架构变更。

迁移背景与挑战

堆叠式 etcd 架构中,etcd 实例与 Kubernetes 控制平面组件(如 API Server)共同部署在同一节点上。这种架构虽然部署简单,但随着集群规模增长会面临以下问题:

  1. 资源竞争:etcd 与控制平面组件共享节点资源
  2. 扩展性限制:etcd 集群规模受限于控制平面节点数量
  3. 维护复杂性:升级或维护 etcd 会影响控制平面可用性

迁移到外部 etcd 集群可以解决这些问题,但需要确保迁移过程中不丢失关键数据,保持集群服务的连续性。

迁移前准备

环境检查

  1. 确认当前 Kubernetes 版本为 v1.30.2
  2. 检查 etcd 数据健康状态
  3. 准备与现有集群 etcd 版本兼容的外部 etcd 集群

资源准备

  1. 准备至少3个专用节点用于外部 etcd 集群
  2. 确保网络连通性:控制平面节点可访问新 etcd 节点
  3. 准备足够的存储空间存放 etcd 数据快照

详细迁移步骤

第一步:创建 etcd 数据快照

在任一控制平面节点执行:

# 获取当前 etcd Pod 名称
ETCD_POD=$(kubectl get pods -n kube-system | grep etcd | awk '{print $1}')

# 创建 etcd 快照
kubectl exec -n kube-system $ETCD_POD -- \
  etcdctl --endpoints=https://127.0.0.1:2379 \
  --cacert=/etc/kubernetes/pki/etcd/ca.crt \
  --cert=/etc/kubernetes/pki/etcd/server.crt \
  --key=/etc/kubernetes/pki/etcd/server.key \
  snapshot save /var/lib/etcd/snapshot.db

第二步:部署外部 etcd 集群

  1. 在新节点上安装与当前版本兼容的 etcd
  2. 使用快照文件初始化新 etcd 集群
  3. 验证新集群数据完整性和成员健康状态

第三步:修改 kubeadm 配置

编辑 kube-system 命名空间中的 kubeadm-config ConfigMap:

kubectl edit cm kubeadm-config -n kube-system

更新 etcd 配置部分,替换为外部 etcd 集群的连接信息。

第四步:更新控制平面组件

  1. 逐个停止控制平面节点的 kubelet 服务
  2. 修改 /etc/kubernetes/manifests/kube-apiserver.yaml 文件,更新 etcd 服务端点
  3. 移除本地 etcd 的静态 Pod 清单文件
  4. 重启 kubelet 服务

第五步:验证迁移结果

  1. 检查所有控制平面组件状态
  2. 验证 API Server 与新 etcd 集群的连接
  3. 测试集群基本功能(部署应用、扩缩容等)

迁移后检查清单

  1. 确认所有控制平面组件处于健康状态
  2. 验证 etcd 集群成员列表和领导状态
  3. 检查核心 Kubernetes 资源(如 Nodes、Pods)是否可正常访问
  4. 监控系统关键指标(API 延迟、etcd 存储增长等)

风险缓解措施

  1. 在非生产环境充分测试迁移流程
  2. 准备完整的回滚方案(包括 etcd 快照和控制平面备份)
  3. 选择业务低峰期执行迁移操作
  4. 考虑分阶段迁移(如先迁移部分控制平面节点)

通过以上严谨的步骤,可以安全地将 kubeadm 管理的 Kubernetes 集群从堆叠式 etcd 架构迁移到外部独立部署的 etcd 集群,同时保持服务的连续性和数据的完整性。

登录后查看全文
热门项目推荐
相关项目推荐