优化Specification项目中的内存搜索评估器实现

2025-07-05 05:52:34作者：咎竹峻Karen

在开源项目Specification中，搜索功能的内存评估器实现存在性能优化空间。本文将深入分析当前实现的问题，并提出改进方案。

当前实现的问题分析

当前SearchMemoryEvaluator的实现虽然代码简洁，但存在几个关键性能问题：

频繁的内存分配：每次调用GroupBy都会创建新的集合，这在处理大数据集时会产生显著开销。
延迟执行问题：LINQ的延迟执行特性导致每次迭代时都会重新计算分组。
非确定性性能：内存分配量随输入集合大小线性增长，无法保证稳定性能。

技术实现细节

原实现的核心逻辑是对搜索条件按组分组，然后对查询结果进行过滤：

foreach (var searchGroup in specification.SearchCriterias.GroupBy(x => x.SearchGroup))
{
    query = query.Where(x => searchGroup.Any(c => c.SelectorFunc(x).Like(c.SearchTerm)));
}

这种实现虽然功能正确，但每次迭代都会产生新的中间集合，对GC压力较大。

优化方案设计

自定义迭代器实现

我们可以通过以下方式优化：

预排序搜索条件：在构造规范时保持搜索条件已按组排序
切片获取分组：利用已排序特性，通过范围操作获取同组条件
减少中间集合：实现自定义迭代器避免临时集合分配

改进后的伪代码

public IEnumerable<T> Evaluate<T>(IEnumerable<T> query, ISpecification<T> spec)
{
    var criterias = spec.SearchCriterias;
    int start = 0;
    
    while (start < criterias.Count)
    {
        int end = start;
        var currentGroup = criterias[start].SearchGroup;
        
        while (end < criterias.Count && criterias[end].SearchGroup == currentGroup)
        {
            end++;
        }
        
        var groupSlice = criterias.Slice(start, end - start);
        query = query.Where(x => groupSlice.Any(c => c.SelectorFunc(x).Like(c.SearchTerm)));
        
        start = end;
    }
    
    return query;
}