微软扩展库中分布式缓存聊天客户端跨平台键值稳定性问题解析

2025-06-27 14:59:37作者：明树来

在微软开源项目dotnet/extensions中，DistributedCachingChatClient组件的缓存键生成机制存在一个值得开发者注意的问题：生成的缓存键在不同操作系统环境下不一致。这个问题在分布式部署场景下尤为关键，值得我们深入探讨其成因和解决方案。

问题背景

DistributedCachingChatClient是一个提供聊天功能缓存的组件，它通过GetCacheKey方法为聊天消息生成唯一的缓存键。在典型的分布式部署场景中，多个Web服务器可能运行在不同操作系统上（如Windows和Linux），同时连接到同一个Redis缓存实例。理想情况下，无论服务器运行在什么操作系统上，相同的输入都应该生成相同的缓存键，以确保缓存命中率。

问题现象

测试表明，当输入相同的聊天消息时：

Windows系统生成的缓存键为：E51327685BFC9E6C0D5B61C513E2F5FB9EDD2C9177EC75379B059EE71466383451E959B1FE9C0865596E4EA44CE8D6C6
Linux系统生成的缓存键为：68F57BBAD7E8DC570361582A11E973AA5B05665766DF422D727C5937738ECB0559AB9338AA68FCFD49467169CEFF9B2A

这种不一致性会导致跨平台部署时缓存失效，降低系统性能。

根本原因

问题的根源在于JSON序列化配置。组件内部使用的AIJsonUtilities.DefaultOptions启用了缩进和换行格式化选项，而不同操作系统使用不同的换行符（Windows使用CRLF，Linux使用LF），这导致序列化后的JSON字符串不同，进而生成的哈希值也不同。

技术深度分析

缓存键生成过程涉及两个关键环节：

JSON序列化：将输入对象转换为JSON字符串
哈希计算：对JSON字符串进行哈希运算生成最终键值

在跨平台场景下，JSON序列化的稳定性受到多种因素影响：

换行符差异（主要因素）
属性排序（次要因素）
数据类型处理（潜在因素）

解决方案

微软团队提供了几种解决思路：

官方推荐方案：覆盖GetCacheKey方法，使用自定义的JsonSerializerOptions，明确禁用缩进格式化：

private static readonly JsonSerializerOptions _jsonSerializerOptions = new()
{
    TypeInfoResolverChain = { new DefaultJsonTypeInfoResolver() },
    Converters = { new JsonStringEnumConverter() },
    WriteIndented = false,  // 关键配置
};