在dotnet/extensions项目中实现AI安全评估器的响应缓存机制

2025-06-27 17:44:58作者：虞亚竹Luna

背景与现状分析

在dotnet/extensions项目中，AI评估功能分为质量评估器(Quality evaluators)和安全评估器(Safety evaluators)两大类。目前质量评估器已经通过ResposeCachingChatClient实现了对LLM响应的缓存机制，而安全评估器在与Azure AI内容安全服务交互时尚未实现响应缓存功能。

技术实现方案

缓存机制的必要性

响应缓存对于AI评估系统至关重要，它能带来以下优势：

性能提升：避免对相同内容重复评估，减少网络延迟
成本优化：降低对云服务的调用次数，节省API费用
结果一致性：确保相同输入获得相同评估结果

安全评估器的特殊性

安全评估器与质量评估器的主要区别在于：

交互对象不同：安全评估器调用Azure AI内容安全服务而非LLM
评估维度不同：安全评估关注有害内容识别而非回答质量
响应结构差异：安全评估返回的是风险评分而非自然语言响应

实现方案设计

基于项目现有架构，可采用以下方式实现安全评估器的缓存：

缓存键设计：以评估内容文本作为缓存键
缓存策略：采用与质量评估器一致的缓存过期策略
线程安全：确保多线程环境下的缓存访问安全
异常处理：正确处理缓存失效或服务不可用情况

实现细节

缓存层抽象

在安全评估器中引入缓存抽象层，保持与现有架构的一致性：

public interface ISafetyEvaluationCache
{
    Task<SafetyEvaluationResult> GetOrAddAsync(string content, Func<Task<SafetyEvaluationResult>> evaluationFunc);
}

缓存实现

基于内存缓存的实现示例：

public class MemorySafetyEvaluationCache : ISafetyEvaluationCache
{
    private readonly IMemoryCache _cache;
    private readonly TimeSpan _expiration;
    
    public async Task<SafetyEvaluationResult> GetOrAddAsync(string content, Func<Task<SafetyEvaluationResult>> evaluationFunc)
    {
        return await _cache.GetOrCreateAsync(content, async entry =>
        {
            entry.SetAbsoluteExpiration(_expiration);
            return await evaluationFunc();
        });
    }
}