首页
/ OpenEBS Mayastor 2.8.0版本发布:NVMe-oF RDMA与CSAL FTL新特性解析

OpenEBS Mayastor 2.8.0版本发布:NVMe-oF RDMA与CSAL FTL新特性解析

2025-07-10 09:14:43作者:咎岭娴Homer

项目背景与技术定位

OpenEBS Mayastor作为云原生环境下的高性能容器存储解决方案,采用用户空间I/O栈设计,通过SPDK框架实现低延迟、高吞吐的持久化存储服务。其核心架构将存储控制平面与数据平面分离,数据平面组件Mayastor IO Engine直接管理物理存储设备,为Kubernetes有状态工作负载提供持久卷服务。

2.8.0版本核心特性

NVMe-oF RDMA传输支持

本次版本最显著的增强是引入了NVMe-over-Fabrics RDMA传输协议支持。传统TCP/IP协议栈在处理存储流量时存在协议栈开销大的问题,而RDMA(远程直接内存访问)技术通过绕过操作系统内核,实现了网络设备与应用程序内存间的直接数据传输。

技术实现特点:

  • 通过Helm chart参数rdmaEnabledrdmaInterface配置RDMA网络接口
  • 支持RoCE(RDMA over Converged Ethernet)协议栈
  • 与现有NVMe/TCP实现共存,可根据网络基础设施灵活选择传输协议
  • 典型应用场景:AI/ML训练、高频交易等低延迟需求场景

性能对比测试显示,在100Gbps RDMA网络环境下,4K随机读延迟可降低至TCP方案的1/3,同时CPU利用率下降约40%。

CSAL FTL分层存储设备

Cloud Storage Acceleration Layer(CSAL)是SPDK提供的闪存转换层(FTL)实现,2.8.0版本将其集成作为新的后端存储类型:

架构优势:

  1. 支持缓存设备与基础设备的层次化组合
    • 快速设备(如Optane)作为写入缓存
    • 大容量设备(如QLC SSD)作为持久化存储
  2. 为新型存储介质提供支持
    • ZNS(Zoned Namespace)设备
    • FDP(Flexible Data Placement)设备
  3. 写入放大优化
    • 通过FTL的地址转换层实现顺序化写入

典型配置示例:

spec:
  deviceClass: "csal-ftl"
  cacheDevice: "/dev/nvme0n1"  # 高性能缓存设备
  baseDevice: "/dev/nvme1n1"   # 大容量基础设备

关键改进与修复

数据可靠性增强

  • 子节点故障处理:在Nexus创建过程中遇到子节点故障时,不再错误地持久化故障状态
  • I/O错误传播:完善了拆分I/O场景下的错误传递机制,确保应用层能感知底层存储问题
  • 重建流程优化:重用I/O句柄减少资源开销,修复重建过程中可能出现的卡死问题

控制平面稳定性

  • 拓扑感知调度:修复标签处理逻辑,确保副本部署符合拓扑约束
  • 卷生命周期管理:
    • 禁止从前端节点外执行unpublish操作
    • 改进关闭状态Nexus的副本保留策略
  • 设备管理:
    • 扩展允许的主设备号列表
    • 正确处理现有子系统的设备关联

架构演进方向

持久化存储事务API

新引入的事务API为未来版本实现跨组件状态一致性提供了基础,关键特性包括:

  • 原子性操作保证
  • 崩溃恢复能力
  • 多操作事务支持

异步化改造

控制平面组件逐步采用异步I/O模型:

  • CSI驱动操作异步化
  • Tokio运行时集成
  • 非阻塞式设备发现

部署与兼容性

系统要求

  • 内核版本:5.4+
  • Kubernetes:1.23-1.25已验证
  • 网络要求:
    • RDMA支持需要相应网卡驱动(如mlx5_core)
    • 建议100Gbps网络基础设施

配置建议

# values.yaml片段
mayastor:
  nvme:
    rdmaEnabled: true
    rdmaInterface: "ens1f0np0"
  resources:
    ioEngine:
      cpu: 4
      hugepages: 8Gi

应用场景建议

推荐场景

  • 金融级低延迟应用:利用RDMA实现微秒级延迟
  • 大规模AI训练:CSAL FTL优化写入性能
  • 边缘计算:精简协议栈降低CPU开销

注意事项

  • 生产环境建议使用Kubernetes 1.24+版本
  • RDMA网络需单独配置流量隔离策略
  • 监控系统需适配用户空间I/O指标采集

后续版本展望

根据社区路线图,未来版本将重点关注:

  1. 磁盘池容量扩展功能
  2. 基于持久化事务API的高可用改进
  3. 对SPDK 24.05新特性的深度集成
  4. 更精细的资源配额管理

本次2.8.0版本通过引入RDMA和CSAL FTL两大核心特性,进一步强化了Mayastor在高性能存储场景的竞争力,为云原生应用提供了更接近裸金属性能的持久化存储方案。

登录后查看全文
热门项目推荐

项目优选

收起
docsdocs
OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
139
1.91 K
kernelkernel
deepin linux kernel
C
22
6
nop-entropynop-entropy
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
8
0
ohos_react_nativeohos_react_native
React Native鸿蒙化仓库
C++
192
273
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
923
551
openHiTLSopenHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
421
392
openGauss-serveropenGauss-server
openGauss kernel ~ openGauss is an open source relational database management system
C++
145
189
金融AI编程实战金融AI编程实战
为非计算机科班出身 (例如财经类高校金融学院) 同学量身定制,新手友好,让学生以亲身实践开源开发的方式,学会使用计算机自动化自己的科研/创新工作。案例以量化投资为主线,涉及 Bash、Python、SQL、BI、AI 等全技术栈,培养面向未来的数智化人才 (如数据工程师、数据分析师、数据科学家、数据决策者、量化投资人)。
Jupyter Notebook
74
64
Cangjie-ExamplesCangjie-Examples
本仓将收集和展示高质量的仓颉示例代码,欢迎大家投稿,让全世界看到您的妙趣设计,也让更多人通过您的编码理解和喜爱仓颉语言。
Cangjie
344
1.3 K
easy-eseasy-es
Elasticsearch 国内Top1 elasticsearch搜索引擎框架es ORM框架,索引全自动智能托管,如丝般顺滑,与Mybatis-plus一致的API,屏蔽语言差异,开发者只需要会MySQL语法即可完成对Es的相关操作,零额外学习成本.底层采用RestHighLevelClient,兼具低码,易用,易拓展等特性,支持es独有的高亮,权重,分词,Geo,嵌套,父子类型等功能...
Java
36
8