使用DiskCache时遇到的序列化与反序列化问题分析

2025-07-08 10:22:28作者：曹令琨Iris

问题背景

在使用Rust的DiskCache进行数据缓存时，开发者遇到了一个看似矛盾的问题：在向磁盘缓存中插入数据时，系统报出了反序列化错误，而不是预期的序列化错误。具体错误信息显示"Error deserializing cached value"，并提示"invalid type: string "48439ad7...", expected an array of length 32"。

问题现象

开发者尝试使用DiskCache来缓存从系统包管理器获取的数据，以避免每次运行命令时都需要进行耗时的解压缩操作。缓存类型为DiskCache<CacheKey, Vec<FileEntryCache>>，其中FileEntryCache是一个相对复杂的结构体，包含文件路径、属性和标志位等信息。

在插入操作中，系统间歇性地报出反序列化错误。有趣的是，前几十次插入通常都能成功，之后才会出现这个错误。更令人困惑的是，错误发生在插入(序列化)操作时，却报告的是反序列化问题。

问题根源

经过深入分析，发现问题出在数据结构的一个细节上：开发者在一个结构体中使用了serialize_with属性来定制序列化行为，但没有提供对应的反序列化处理。这种不对称的序列化/反序列化实现导致了缓存系统在内部处理时出现了问题。

DiskCache在写入数据时，可能需要进行一些内部验证或缓存管理操作，这些操作需要读取(反序列化)已缓存的数据。当遇到只有序列化定制而没有反序列化定制的数据结构时，就会导致反序列化失败。

技术细节

在Rust的serde框架中，序列化和反序列化通常应该成对实现。当使用serialize_with属性时，最佳实践是同时提供deserialize_with属性，以确保数据能够双向转换。例如：

#[derive(Serialize, Deserialize)]
struct Example {
    #[serde(serialize_with = "custom_serialize")]
    #[serde(deserialize_with = "custom_deserialize")]
    field: SomeType,
}

如果只提供序列化定制而没有反序列化定制，当系统尝试反序列化数据时，就会使用默认的反序列化逻辑，这可能无法正确处理定制序列化后的数据格式，从而导致类型不匹配错误。