Longhorn项目中SPDK逻辑卷删除操作的改进分析

2025-06-02 22:47:03作者：卓艾滢Kingsley

Cloud-Native distributed storage built on and for Kubernetes

项目地址：https://gitcode.com/gh_mirrors/lo/longhorn

背景介绍

在分布式存储系统Longhorn中，SPDK（Storage Performance Development Kit）作为高性能存储开发工具包，负责底层存储的管理和操作。其中逻辑卷（lvol）是SPDK提供的一种重要存储抽象，而blob则是SPDK中用于管理数据块的核心数据结构。

问题发现

在Longhorn项目的日常维护过程中，开发团队发现了一个关于逻辑卷删除操作的异常行为。当SPDK尝试删除一个逻辑卷时，如果该逻辑卷对应的blob正被其他操作占用（例如正在进行校验和计算），blob层会返回"busy"错误。然而，当前的lvol层处理方式存在问题——它会强制移除该逻辑卷，仅仅从内存中的列表中删除相关条目并释放内存，但实际上blob仍然存在于持久化存储中。

这种处理方式导致了严重的数据一致性问题：当SPDK目标服务（spdk_tgt）重启后，由于blob仍然存在，系统会重新创建该逻辑卷，这与用户预期的删除行为相违背。

技术分析

在SPDK的底层实现中，lvol_destroy操作包含以下关键步骤：

首先尝试通过常规方式删除底层blob
如果blob层返回"busy"错误（表示资源被占用）
当前实现会执行强制移除（forced removal）

这种强制移除实际上是一种"半删除"状态，它只处理了内存中的数据结构，而没有真正清除持久化存储中的数据。从系统设计的角度来看，这违反了事务处理的原子性原则——操作要么完全成功，要么完全失败，不应该存在这种中间状态。

解决方案

针对这一问题，Longhorn开发团队提出了以下改进方案：

当blob层返回"busy"错误时，lvol层不应该执行强制移除
而是应该将错误直接返回给RPC调用者
保持逻辑卷的完整状态，确保数据一致性

这种修改确保了删除操作的原子性：要么完整删除逻辑卷及其底层blob，要么完全保留，不存在中间状态。同时，这也给了上层应用正确处理此类情况的机会——可以等待资源释放后重试删除操作。

测试验证

为了验证这一改进的有效性，开发团队设计了一套详细的测试流程：

创建基础存储环境（AI0块设备、逻辑卷存储池）
创建逻辑卷并通过NVMe协议导出
写入测试数据并创建备份
启动备份校验和计算
在校验和计算过程中尝试删除备份
验证删除操作是否失败且备份是否仍然存在

测试结果表明，改进后的版本确实能够正确处理并发操作冲突，保证了数据的一致性。当备份正在被使用时，删除操作会正确返回错误，而不会导致备份被部分删除。

技术意义

这一改进对于Longhorn项目的稳定性具有重要意义：

解决了潜在的数据一致性问题
提供了更可靠的并发操作处理机制
符合存储系统设计的ACID原则
为上层应用提供了更明确的错误处理路径

对于使用Longhorn的用户来说，这意味着在进行备份管理等操作时，系统行为更加可预测和可靠，降低了数据损坏的风险。

总结

通过对SPDK逻辑卷删除操作的这一改进，Longhorn项目进一步提升了其在并发操作场景下的数据一致性保障能力。这种对底层细节的关注和持续优化，体现了Longhorn作为生产级存储解决方案的成熟度和可靠性。对于系统管理员和开发者而言，理解这些底层机制有助于更好地部署和维护Longhorn存储系统。

Cloud-Native distributed storage built on and for Kubernetes

项目地址：https://gitcode.com/gh_mirrors/lo/longhorn

登录后查看全文

项目优选

收起

deepin linux kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

昇腾LLM分布式训练框架

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

Oohos_react_native

React Native鸿蒙化仓库