EF Core中自引用实体查询的Include与ThenInclude行为差异解析

2025-05-16 18:38:37作者：滕妙奇

引言

在使用Entity Framework Core处理自引用实体关系时，开发人员经常会遇到一些意料之外的行为。本文将通过一个典型场景，深入分析EF Core中Include和ThenInclude方法在处理自引用实体时的不同表现，以及如何正确构建查询以获得预期结果。

场景描述

考虑一个常见的业务场景：预订系统中有Booking(预订)和LineItem(订单项)两个实体，其中LineItem具有自引用关系，即一个订单项可以有多个子订单项。

实体模型分析

首先让我们看看实体模型的定义：

public class Booking
{
    public Guid Id { get; set; }
    public List<LineItem> LineItems { get; set; }
}

public class LineItem
{
    public Guid Id { get; set; }
    public Guid BookingId { get; set; }
    public LineItem ParentLineItem { get; set; }
    public Guid? ParentLineItemId { get; set; }
    public List<LineItem> SubLineItems { get; set; }
}

在这个模型中，LineItem通过ParentLineItemId建立了自引用关系，同时通过BookingId与Booking实体关联。

查询行为差异

从Booking实体查询

当从Booking实体开始查询，并尝试只加载顶级LineItem及其子项时：

var result = await _context.Bookings
    .Include(b => b.LineItems.Where(l => !l.ParentLineItemId.HasValue))
    .ThenInclude(l => l.SubLineItems)
    .ToListAsync();

实际查询结果会出现一个意外现象：子LineItem不仅会出现在父LineItem的SubLineItems集合中，还会直接出现在Booking的LineItems集合中。

从LineItem实体直接查询

相比之下，直接从LineItem实体查询：

var result = await _context.LineItem
    .Where(l => !l.ParentLineItemId.HasValue)
    .Include(l => l.SubLineItems)
    .ToListAsync();

这种查询方式能得到预期结果：只有顶级LineItem出现在结果中，子LineItem只出现在各自父项的SubLineItems集合中。

原因分析

这种差异的根本原因在于EF Core的关系追踪机制和导航属性的处理方式：

关系完整性：EF Core会确保加载的实体之间的关系完整性。在Booking查询中，所有LineItem(包括子项)都有BookingId，因此EF Core认为它们都属于Booking的LineItems集合。
导航属性处理：Include和ThenInclude会触发相关实体的加载，但不会自动过滤已加载的实体。EF Core会将这些实体添加到适当的集合中，以确保对象图的完整性。
查询起点影响：从Booking开始查询时，EF Core会考虑所有与Booking关联的LineItem；而从LineItem开始查询时，只处理显式指定的关系。

解决方案

要解决这个问题，有以下几种方法：

修改数据模型：如果子LineItem不应该直接属于Booking，可以考虑将子项的BookingId设为null，这样它们就不会出现在Booking的LineItems集合中。
使用投影查询：通过Select投影只返回需要的数据结构，避免EF Core的关系追踪带来的副作用。
客户端过滤：在查询后手动过滤结果，移除不需要的项。
使用AsNoTracking：对于只读场景，可以使用AsNoTracking来避免EF Core的关系追踪。