首页
/ Rook Ceph集群中CephFS挂载失败的排查与解决方案

Rook Ceph集群中CephFS挂载失败的排查与解决方案

2025-05-18 10:27:37作者:蔡丛锟

问题背景

在使用Rook Ceph部署分布式存储系统时,用户遇到了CephFS卷无法挂载到Pod的问题。具体表现为Pod处于ContainerCreating状态,错误日志显示"unable to get monitor info from DNS SRV with service name: ceph-mon"。本文将深入分析这一问题,并提供多种解决方案。

环境配置

用户部署环境为:

  • Kubernetes集群:1个控制节点+3个工作节点,使用kubeadm部署
  • 操作系统:Ubuntu 18.04 LTS(内核版本4.15)
  • Rook版本:v1.15.4
  • Ceph版本:18.2.4 (Reef稳定版)
  • CNI插件:Cilium

问题现象

虽然Ceph集群状态显示为HEALTH_OK,所有相关Pod均正常运行,但在尝试挂载CephFS卷时出现以下错误:

unable to get monitor info from DNS SRV with service name: ceph-mon
2024-11-11T10:06:52.478+0000 7f2266ce0000 -1 failed for service _ceph-mon._tcp
mount error 95 = Operation not supported

根本原因分析

经过深入排查,发现该问题由多个因素共同导致:

  1. DNS SRV记录缺失:Ceph客户端默认会尝试通过DNS SRV记录查找名为"ceph-mon"的服务,但Rook默认创建的是"rook-ceph-mon-a"、"rook-ceph-mon-b"等格式的服务名称。

  2. 内核兼容性问题:Ubuntu 18.04使用的4.15内核对CephFS的msgr2协议支持不完善,特别是在使用较新版本的Ceph时。

  3. 网络配置问题:某些CNI插件(如Cilium)可能需要特殊配置才能正确处理Ceph的监控流量。

解决方案

方案一:创建ceph-mon服务(临时解决方案)

作为临时解决方案,可以手动创建一个名为"ceph-mon"的Service,复制rook-ceph-mon-a的配置:

apiVersion: v1
kind: Service
metadata:
  name: ceph-mon
  namespace: rook-ceph
spec:
  ports:
  - name: mon
    port: 6789
    protocol: TCP
    targetPort: 6789
  - name: msgr2
    port: 3300
    protocol: TCP
    targetPort: 3300
  selector:
    app: rook-ceph-mon
    mon: a
  type: ClusterIP

注意:此方案仅作为临时解决方案,因为:

  1. fsName: myfs pool: myfs-data0 c
登录后查看全文
热门项目推荐
相关项目推荐

项目优选

收起
kernelkernel
deepin linux kernel
C
24
7
nop-entropynop-entropy
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
9
1
Cangjie-ExamplesCangjie-Examples
本仓将收集和展示高质量的仓颉示例代码,欢迎大家投稿,让全世界看到您的妙趣设计,也让更多人通过您的编码理解和喜爱仓颉语言。
Cangjie
376
3.31 K
flutter_flutterflutter_flutter
暂无简介
Dart
622
140
leetcodeleetcode
🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer(第 2 版)》、《程序员面试金典(第 6 版)》题解
Java
62
20
openHiTLSopenHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
1.03 K
479
ops-mathops-math
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
648
263
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
1.1 K
620
giteagitea
喝着茶写代码!最易用的自托管一站式代码托管平台,包含Git托管,代码审查,团队协作,软件包和CI/CD。
Go
23
0
cherry-studiocherry-studio
🍒 Cherry Studio 是一款支持多个 LLM 提供商的桌面客户端
TypeScript
794
77