django-guardian性能优化：解决filter_perms_queryset_by_objects函数查询效率问题

2025-06-19 18:10:37作者：仰钰奇

在基于django-guardian 2.4.0版本开发的项目中，我们遇到了一个严重的性能问题。当用户通过PATCH请求访问FirstTable数据时，响应时间从2秒激增至30秒以上。经过深入分析，我们发现问题出在guardian的filter_perms_queryset_by_objects函数实现上。

问题背景

我们的系统采用了django-guardian作为权限管理框架，主要管理四个核心数据表：

FirstTable表：约250万条记录
FirstTableType表：约50条记录
FirstTableTableType表：约260万条记录（多对多关联表）
FirstTableUserObjectPermission表：约5000万条记录（权限关联表）

系统环境配置为：

数据库：Aurora MySQL 8.0.23
Django框架：3.0.14版本
DRF框架：3.11.0版本

性能问题分析

问题的核心出现在shortcuts.py文件的第848行代码处。当用户仅拥有对象级权限（而非全局权限）时，系统会执行一个效率极低的查询操作。该查询会对整个权限表进行全表扫描，导致响应时间大幅增加。

原始实现中使用了list()函数将查询结果转换为列表：

**{'{}__in'.format(field): list(objects.values_list('pk', flat=True).distinct().order_by())})

这种实现方式存在两个主要问题：

强制立即执行查询并加载所有结果到内存
在大型数据集上会产生显著的性能开销

优化方案

我们提出的优化方案是移除不必要的list()转换，直接使用QuerySet的惰性求值特性：

**{'{}__in'.format(field): objects.values_list('pk', flat=True).distinct().order_by()})

这一改动带来了显著的性能提升：

对于拥有全局权限的用户：查询时间保持在1秒以内
对于仅拥有对象级权限的用户：查询时间从30秒以上降至可接受范围

技术原理

优化方案的有效性基于Django QuerySet的两个重要特性：

惰性求值：Django的QuerySet默认不会立即执行数据库查询，只有在真正需要结果时才会访问数据库
查询优化：Django的ORM能够智能地将链式调用转换为高效的SQL语句

通过避免提前执行查询和加载数据，我们减少了不必要的数据传输和处理开销，特别是在处理大型数据集时效果更为明显。

实际影响

这一优化对系统整体性能产生了积极影响：

API响应时间恢复正常水平
数据库负载显著降低
系统在高并发情况下的稳定性得到提升

最佳实践建议

基于这一案例，我们总结出以下django-guardian使用建议：

在权限查询中尽量避免强制提前执行查询
对于大型权限表，应特别关注查询效率
定期审查权限相关的数据库查询性能
考虑使用direct foreign key方式优化权限查询

这一优化方案已被纳入项目代码库，并计划在未来版本中作为标准实现。

登录后查看全文