libfuse中passthrough模式的文件描述符管理机制解析

2025-06-06 02:43:23作者：仰钰奇

The reference implementation of the Linux FUSE (Filesystem in Userspace) interface

项目地址：https://gitcode.com/gh_mirrors/li/libfuse

背景介绍

libfuse是一个用户空间文件系统开发框架，它允许开发者在不编写内核模块的情况下实现自定义文件系统。在libfuse 3.17及后续版本中，引入了一个称为"passthrough"的功能，这个功能允许FUSE文件系统将某些操作直接传递给底层文件系统，从而提高性能。

passthrough模式的核心机制

passthrough模式的核心在于fuse_passthrough_open函数，它允许FUSE文件系统获取底层文件系统的文件描述符。然而，这个功能有一个重要的限制：每个文件节点只能有一个活动的backing id。

技术细节分析

单backing id限制：当一个文件被打开时，通过fuse_passthrough_open获取的backing id会被存储在文件信息结构体(fuse_file_info)中。系统设计上强制要求每个文件节点只能有一个活动的backing id，这意味着：
- 不能为同一个文件多次调用fuse_passthrough_open获取不同的描述符
- 所有对该文件的操作都必须通过同一个backing id进行
并行访问的影响：这种设计对并行文件操作有直接影响：
- 并行读取操作可以正常工作
- 并行写入操作或混合读写操作可能会失败（返回EIO错误）
与Android实现的区别：值得注意的是，Android的FUSE实现允许每个文件描述符有不同的backing id，但这种设计没有被上游libfuse接受。上游实现选择了更简单的单backing id模型。

设计考量

这种限制的设计背后有几个技术考量：

简化实现：单backing id模型大大简化了实现复杂度，避免了需要处理多个底层描述符之间的同步问题。
一致性保证：通过强制所有操作都通过同一个描述符，可以更好地保证文件操作的一致性。
性能权衡：虽然限制了并行性，但避免了多描述符管理带来的开销。

最佳实践建议

基于这些限制，开发者在实现FUSE文件系统时应注意：

对于需要高性能并行访问的场景，应考虑不使用passthrough模式。
如果必须使用passthrough，应该：
- 确保文件操作是串行的
- 或者实现自己的缓冲和同步机制
在文档中明确说明passthrough模式的限制，避免用户困惑。

未来可能的扩展

虽然当前实现有这些限制，但未来可能会扩展支持：

允许多个backing id对应同一个文件的不同区域
更精细的控制机制来管理并行访问

这种扩展将需要在保持现有简单性的同时，提供更大的灵活性，是一个值得关注的发展方向。

The reference implementation of the Linux FUSE (Filesystem in Userspace) interface

项目地址：https://gitcode.com/gh_mirrors/li/libfuse

登录后查看全文

项目优选

收起

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。

Oohos_react_native

React Native鸿蒙化仓库