Rook-ceph中SSD磁盘被识别为HDD的问题分析与解决方案

2025-05-18 04:18:37作者：俞予舒Fleming

问题背景

在使用Rook-ceph部署的Kubernetes存储集群中，用户遇到了一个常见但影响重大的问题：尽管集群使用的是SSD磁盘，但Ceph却将这些磁盘识别为HDD类型。这种错误的设备类型识别导致了多个性能问题，包括恢复速度缓慢（仅5-10MB/s）、PG（Placement Group）分布不合理以及频繁的数据降级警告。

问题表现

设备类型识别错误：通过ceph osd tree命令查看，所有OSD的deviceClass显示为HDD，而实际物理设备是SSD
恢复性能低下：在数据恢复过程中，速度仅为5-10MB/s，导致完全恢复需要30小时以上
集群健康警告：频繁出现HEALTH_WARN状态，提示数据冗余降级和PG数量过多
PG分布问题：警告显示"too many PGs per OSD (265 > max 250)"

根本原因分析

自动发现机制失效：Rook的早期版本（如v1.12.8）在Azure环境中可能无法正确识别SSD设备类型
CRUSH算法影响：错误的设备类型导致CRUSH算法无法优化数据分布和恢复策略
性能参数不匹配：HDD和SSD有不同的性能特性，错误的设备类型导致Ceph使用了不适合SSD的默认参数
大容量磁盘挑战：4TB的单个OSD容量较大，加剧了PG分布问题

解决方案

1. 显式设置设备类型

对于Rook v1.15.2及以上版本，可以在Cluster CRD中明确指定设备类型：

storage:
  config:
    deviceClass: "ssd"
  allowDeviceClassUpdate: true

对于使用PVC的部署方式，需要在VolumeClaimTemplate中添加注解：

metadata:
  annotations:
    crushDeviceClass: "ssd"

2. 升级Rook版本

建议至少升级到v1.15.2或更高版本，这些版本改进了设备类型识别和更新机制。

3. 调整恢复参数

通过Ceph的mclock配置可以提高恢复优先级：

ceph config set osd osd_mclock_profile high_recovery_ops
ceph config set osd osd_mclock_scheduler_background_recovery true

4. PG数量优化

对于4TB的OSD，建议重新计算和调整PG数量：

ceph osd pool set <pool-name> pg_num <new-value>
ceph osd pool set <pool-name> pgp_num <new-value>

实施效果

用户反馈在正确设置设备类型为SSD后：

恢复速度从20-30MB/s提升到200MB/s以上
集群稳定性显著提高
数据降级警告减少

最佳实践建议

生产环境验证：在非生产环境先验证设备类型更改的影响
监控恢复过程：更改后密切监控集群状态和性能指标
定期维护：定期检查PG分布和设备类型设置
容量规划：合理规划OSD容量，避免单个OSD过大导致PG分布问题

总结

Rook-ceph集群中SSD被错误识别为HDD是一个常见但影响重大的配置问题。通过显式设置设备类型、升级Rook版本和优化恢复参数，可以显著提高集群性能和稳定性。对于生产环境，建议在维护窗口期进行这些变更，并做好充分的监控和回滚准备。

rook

Storage Orchestration for Kubernetes

项目地址：https://gitcode.com/gh_mirrors/roo/rook

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

168

nop-entropy

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解