EntityFramework Core中自引用实体的Include与ThenInclude查询差异解析

2025-05-16 00:39:22作者：蔡丛锟

引言

在使用EntityFramework Core处理自引用实体关系时，开发人员经常会遇到一个典型问题：当通过Include和ThenInclude方法加载嵌套的子项集合时，查询结果中会出现意料之外的数据结构。本文将深入分析这一现象的技术原理，并通过实际案例展示如何正确构建查询以避免数据重复问题。

自引用实体模型分析

让我们先看一个典型的自引用实体模型设计：

public class LineItem
{
    public Guid Id { get; set; }
    public Guid BookingId { get; set; }
    public LineItem ParentLineItem { get; set; }
    public Guid? ParentLineItemId { get; set; }
    public List<LineItem> SubLineItems { get; set; }
}

在这个模型中，LineItem通过ParentLineItemId属性实现了自引用关系，一个LineItem可以有多个SubLineItems子项。同时，每个LineItem还通过BookingId关联到Booking实体。

问题现象

开发人员通常会尝试以下两种查询方式：

方式一：通过Booking实体查询

var result = await _context.Bookings
    .Include(b => b.LineItems.Where(l => !l.ParentLineItemId.HasValue))
    .ThenInclude(l => l.SubLineItems)
    .ToListAsync();

方式二：直接查询LineItem

var result = await _context.LineItem
    .Where(l => !l.ParentLineItemId.HasValue)
    .Include(l => l.SubLineItems)
    .ToListAsync();

这两种方式会产生不同的结果结构。方式一会导致子项LineItem同时出现在顶级列表和父项的SubLineItems集合中，而方式二则只会在父项的SubLineItems中包含子项。

技术原理剖析

造成这种差异的核心原因在于EntityFramework Core的关系追踪机制：

导航属性加载行为：当通过Booking实体查询时，EF Core会追踪所有与Booking关联的LineItem，无论它们是否作为子项存在
外键约束影响：由于子项LineItem也包含BookingId，EF Core会认为它们直接属于Booking，因此会出现在顶级列表中
关系完整性：EF Core确保加载的实体关系图保持完整，这可能导致实体以多种路径出现在结果中

解决方案与实践建议

要解决这个问题，有以下几种技术方案：

方案一：调整数据模型

// 修改子项的BookingId为可空
public class LineItem
{
    // 其他属性...
    public Guid? BookingId { get; set; } // 改为可空类型
}

通过将子项的BookingId设为null，可以明确表示子项只应通过父项关系访问。

方案二：使用显式查询过滤

var result = await _context.Bookings
    .Select(b => new 
    {
        b.Id,
        LineItems = b.LineItems
            .Where(l => !l.ParentLineItemId.HasValue)
            .Select(l => new 
            {
                l.Id,
                SubLineItems = l.SubLineItems
            })
    })
    .ToListAsync();

使用投影查询可以精确控制返回的数据结构。

方案三：后处理结果集

var result = (await _context.Bookings
    .Include(b => b.LineItems.Where(l => !l.ParentLineItemId.HasValue))
    .ThenInclude(l => l.SubLineItems)
    .ToListAsync())
    .Select(b => 
    {
        b.LineItems = b.LineItems.Where(l => !l.ParentLineItemId.HasValue).ToList();
        return b;
    });

在内存中对结果进行二次过滤。