Dapper多表查询结果合并问题解析与解决方案

2025-05-12 01:03:03作者：苗圣禹Peter

多表查询结果合并的挑战

在使用Dapper进行数据库操作时，开发人员经常会遇到需要从多个关联表中获取数据并合并到一个对象中的场景。本文以一个文档管理系统为例，展示了如何解决Dapper多表查询结果合并时只返回第一条匹配记录的问题。

问题背景

在文档管理系统中，我们需要查询一个文档的详细信息，包括文档本身的信息、关联的标签以及协作者信息。通过SQL查询可以轻松获取这些数据，但使用Dapper的QueryAsync方法进行映射时，发现最终返回的对象只包含了第一条匹配记录，而后续记录中的关联数据没有被正确合并。

数据模型分析

系统包含以下几个核心数据模型：

文档模型(DocumentDto)：存储文档的基本信息，如ID、名称、描述等
标签模型(LabelDto)：表示文档的分类标签
协作者模型(CollaboratorDto)：记录可以访问该文档的用户及其权限

原始解决方案的问题

最初使用Dapper的QueryAsync方法进行多表映射时，虽然映射函数会被正确调用多次，但每次调用都是独立处理的，导致前一次调用中对文档对象的修改（如添加标签或协作者）在下一次调用中无法保留。

优化后的解决方案

通过分析Dapper的工作原理，我们采用了分组聚合的方式来合并查询结果：

首先执行原始查询，获取所有行数据
按照文档ID进行分组
对每个分组：
- 取第一个文档对象作为基础
- 从所有行中提取标签信息，去重后合并
- 从所有行中提取协作者信息，去重后合并

实现代码解析

var documents = await connection.QueryAsync<DocumentDto, LabelDto, CollaboratorDto, DocumentDto>(
    GetDocumentSql,
    (doc, label, collaborator) => {
        if (label is not null && label.LabelId != Guid.Empty) {
            doc.Labels.Add(label);
        }
        if (collaborator.ProfileId != Guid.Empty) {
            doc.Collaborators.Add(collaborator);
        }
        return doc;
    }, 
    new { Id = documentId.ToString() },
    splitOn: "LabelId,DocumentId");

var result = documents
    .GroupBy(d => d.Id)
    .Select(g => {
        var groupedDocument = g.First();
        groupedDocument.Labels = g.Select(d => d.Labels.Single())
            .GroupBy(l => l.LabelId)
            .Select(l => l.First())
            .ToList();
        groupedDocument.Collaborators = g.Select(d => d.Collaborators.Single())
            .GroupBy(c => c.ProfileId)
            .Select(c => c.First())
            .ToList();
        return groupedDocument;
    });