OpenEBS Mayastor 2.8.0版本发布：NVMe-oF RDMA与CSAL FTL新特性解析

2025-07-10 05:32:23作者：咎岭娴Homer

项目背景与技术定位

OpenEBS Mayastor作为云原生环境下的高性能容器存储解决方案，采用用户空间I/O栈设计，通过SPDK框架实现低延迟、高吞吐的持久化存储服务。其核心架构将存储控制平面与数据平面分离，数据平面组件Mayastor IO Engine直接管理物理存储设备，为Kubernetes有状态工作负载提供持久卷服务。

2.8.0版本核心特性

NVMe-oF RDMA传输支持

本次版本最显著的增强是引入了NVMe-over-Fabrics RDMA传输协议支持。传统TCP/IP协议栈在处理存储流量时存在协议栈开销大的问题，而RDMA(远程直接内存访问)技术通过绕过操作系统内核，实现了网络设备与应用程序内存间的直接数据传输。

技术实现特点：

通过Helm chart参数rdmaEnabled和rdmaInterface配置RDMA网络接口
支持RoCE(RDMA over Converged Ethernet)协议栈
与现有NVMe/TCP实现共存，可根据网络基础设施灵活选择传输协议
典型应用场景：AI/ML训练、高频交易等低延迟需求场景

性能对比测试显示，在100Gbps RDMA网络环境下，4K随机读延迟可降低至TCP方案的1/3，同时CPU利用率下降约40%。

CSAL FTL分层存储设备

Cloud Storage Acceleration Layer(CSAL)是SPDK提供的闪存转换层(FTL)实现，2.8.0版本将其集成作为新的后端存储类型：

架构优势：

支持缓存设备与基础设备的层次化组合
- 快速设备(如Optane)作为写入缓存
- 大容量设备(如QLC SSD)作为持久化存储
为新型存储介质提供支持
- ZNS(Zoned Namespace)设备
- FDP(Flexible Data Placement)设备
写入放大优化
- 通过FTL的地址转换层实现顺序化写入

典型配置示例：

spec:
  deviceClass: "csal-ftl"
  cacheDevice: "/dev/nvme0n1"  # 高性能缓存设备
  baseDevice: "/dev/nvme1n1"   # 大容量基础设备

关键改进与修复

数据可靠性增强

子节点故障处理：在Nexus创建过程中遇到子节点故障时，不再错误地持久化故障状态
I/O错误传播：完善了拆分I/O场景下的错误传递机制，确保应用层能感知底层存储问题
重建流程优化：重用I/O句柄减少资源开销，修复重建过程中可能出现的卡死问题

控制平面稳定性

拓扑感知调度：修复标签处理逻辑，确保副本部署符合拓扑约束
卷生命周期管理：
- 禁止从前端节点外执行unpublish操作
- 改进关闭状态Nexus的副本保留策略
设备管理：
- 扩展允许的主设备号列表
- 正确处理现有子系统的设备关联

架构演进方向

持久化存储事务API

新引入的事务API为未来版本实现跨组件状态一致性提供了基础，关键特性包括：

原子性操作保证
崩溃恢复能力
多操作事务支持

异步化改造

控制平面组件逐步采用异步I/O模型：

CSI驱动操作异步化
Tokio运行时集成
非阻塞式设备发现

部署与兼容性

系统要求

内核版本：5.4+
Kubernetes：1.23-1.25已验证
网络要求：
- RDMA支持需要相应网卡驱动(如mlx5_core)
- 建议100Gbps网络基础设施

配置建议

# values.yaml片段
mayastor:
  nvme:
    rdmaEnabled: true
    rdmaInterface: "ens1f0np0"
  resources:
    ioEngine:
      cpu: 4
      hugepages: 8Gi

应用场景建议

注意事项

生产环境建议使用Kubernetes 1.24+版本
RDMA网络需单独配置流量隔离策略
监控系统需适配用户空间I/O指标采集

后续版本展望

根据社区路线图，未来版本将重点关注：

磁盘池容量扩展功能
基于持久化事务API的高可用改进
对SPDK 24.05新特性的深度集成
更精细的资源配额管理

本次2.8.0版本通过引入RDMA和CSAL FTL两大核心特性，进一步强化了Mayastor在高性能存储场景的竞争力，为云原生应用提供了更接近裸金属性能的持久化存储方案。

mayastor

A cloud native declarative data plane in containers for containers

项目地址：https://gitcode.com/gh_mirrors/ma/mayastor

登录后查看全文