Trieve项目中文件删除时未清理分片组的Bug分析与修复

2025-07-04 21:45:14作者：盛欣凯Ernestine

在分布式存储系统Trieve的开发过程中，团队发现了一个关于文件删除功能的严重Bug：当用户通过SDK删除文件并设置delete_chunks参数为true时，系统未能正确删除关联的分片组及其内容。这个Bug直接影响到了系统的数据清理机制，可能导致存储空间浪费和数据不一致问题。

问题背景

Trieve作为一个分布式存储系统，采用分片(Chunk)的方式存储大文件。每个文件会被分割成多个分片，这些分片被组织在一个逻辑组(Group)中。当用户删除文件时，系统应该提供两种选择：

仅删除文件元数据，保留分片数据
彻底删除文件及其所有分片数据

后者通过delete_chunks参数控制，当设置为true时，系统应删除文件及其所有关联的分片组。

Bug现象分析

开发团队发现，当通过SDK执行文件删除操作时，即使明确设置了delete_chunks=true，系统也没有删除相关的分片组。经过深入排查，发现问题根源在于SDK与服务器端的参数传递机制。

具体表现为：

通过REST API直接调用时功能正常
通过SDK调用时功能异常
仅影响分片组的删除，不影响文件元数据的删除

根本原因

技术团队经过代码审查和测试，确定了问题的根本原因：

URL查询参数缺失：SDK在构造HTTP请求时，未能正确将delete_chunks参数作为URL查询字符串(query parameter)附加到请求URL中。
参数处理不一致：服务器端虽然支持通过查询参数接收delete_chunks，但SDK却使用了不同的参数传递方式(如请求体)，导致服务器无法正确识别删除分片的指令。
默认行为差异：由于参数传递失败，服务器端采用了默认行为(即delete_chunks=false)，仅删除文件元数据而保留了分片组。

解决方案

针对这一问题，技术团队实施了以下修复措施：

SDK修正：统一SDK中的参数传递方式，确保delete_chunks参数作为URL查询参数正确传递。
服务器端增强：
- 增加对多种参数传递方式的支持(URL查询参数和请求体)
- 完善参数验证逻辑
- 添加更明确的错误日志
测试覆盖：
- 新增单元测试验证参数传递
- 增加集成测试确保端到端功能
- 添加边界条件测试

技术实现细节

在具体实现上，修复涉及以下关键点：

SDK请求构造：

// 修复后的请求构造逻辑
let query_params = format!("?delete_chunks={}", delete_chunks);
let url = format!("{}/file/{}", base_url, file_id) + &query_params;

服务器端路由处理：

// 增强后的路由处理
.delete("/file/:id")
.query::<DeleteParams>()
.handler(delete_file_handler)

删除逻辑增强：

async fn delete_file_handler(params: DeleteParams) {
    if params.delete_chunks {
        // 删除关联分片组逻辑
        delete_chunk_group(file_id).await;
    }
    // 删除文件元数据逻辑
    delete_file_metadata(file_id).await;
}