首页
/ Longhorn存储卷副本在新增磁盘中失效问题分析

Longhorn存储卷副本在新增磁盘中失效问题分析

2025-06-02 17:40:08作者:裘晴惠Vivianne

问题背景

在使用Longhorn v1.6.0版本部署的Kubernetes集群中,当管理员向节点添加新磁盘后,发现存储卷副本无法正常工作。具体表现为:所有位于新增磁盘上的副本都处于"stopped"状态,导致相关PVC无法正常挂载,最终出现"deadline context exceeded"错误。

环境配置

该问题出现在基于RKE构建的Kubernetes集群中,节点运行Debian 10操作系统,内核版本为5.10.0-32-amd64。集群包含2个控制平面节点,使用SSD存储设备,节点间网络带宽为1.17Gbps。Longhorn通过Helm Chart部署,并由Argo-CD管理。

问题现象

当管理员按照v1.6.0文档指引向节点添加新磁盘后,Longhorn UI能够正确识别新增的存储空间。然而,任何将副本放置在这些新磁盘上的存储卷都无法正常运行。副本状态持续显示为"stopped",而关联的Pod和PVC则因上下文超时错误而无法完成挂载操作。

问题排查

从用户提供的支持包分析,可以观察到以下关键点:

  1. 实例管理器(instance manager)组件存在内存使用过高的问题
  2. 删除并重建实例管理器Pod后,系统经历了约5天的异常状态
  3. 最终系统自行恢复正常,但具体原因不明

解决方案

根据用户反馈,最终通过以下步骤解决了问题:

  1. 移除出现问题的磁盘
  2. 删除并重建实例管理器Pod
  3. 等待系统自行恢复(可能需要较长时间)

值得注意的是,升级到更新的Longhorn版本(如v1.6.3)可能有助于避免类似问题的发生。新版本通常包含对资源管理和磁盘处理的改进。

经验总结

对于在生产环境中使用Longhorn的管理员,建议:

  1. 在添加新磁盘前,确保所有节点上的Longhorn组件版本一致
  2. 监控实例管理器的资源使用情况,特别是内存消耗
  3. 考虑升级到最新的稳定版本,以获得更好的稳定性和性能
  4. 在非高峰时段执行存储扩容操作,预留足够的恢复时间窗口

这种类型的存储问题往往需要耐心等待系统自行恢复,强制干预可能会延长故障时间。建立完善的监控体系和制定详细的应急预案对于维护Longhorn存储系统的稳定性至关重要。

登录后查看全文
热门项目推荐

项目优选

收起
ohos_react_nativeohos_react_native
React Native鸿蒙化仓库
C++
178
262
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
868
513
openGauss-serveropenGauss-server
openGauss kernel ~ openGauss is an open source relational database management system
C++
129
183
openHiTLSopenHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
268
308
HarmonyOS-ExamplesHarmonyOS-Examples
本仓将收集和展示仓颉鸿蒙应用示例代码,欢迎大家投稿,在仓颉鸿蒙社区展现你的妙趣设计!
Cangjie
398
373
CangjieCommunityCangjieCommunity
为仓颉编程语言开发者打造活跃、开放、高质量的社区环境
Markdown
1.07 K
0
ShopXO开源商城ShopXO开源商城
🔥🔥🔥ShopXO企业级免费开源商城系统,可视化DIY拖拽装修、包含PC、H5、多端小程序(微信+支付宝+百度+头条&抖音+QQ+快手)、APP、多仓库、多商户、多门店、IM客服、进销存,遵循MIT开源协议发布、基于ThinkPHP8框架研发
JavaScript
93
15
note-gennote-gen
一款跨平台的 Markdown AI 笔记软件,致力于使用 AI 建立记录和写作的桥梁。
TSX
83
4
cherry-studiocherry-studio
🍒 Cherry Studio 是一款支持多个 LLM 提供商的桌面客户端
TypeScript
599
58
GitNextGitNext
基于可以运行在OpenHarmony的git,提供git客户端操作能力
ArkTS
10
3