FerretDB索引优化：PostgreSQL后端索引使用问题解析

2025-05-23 07:00:03作者：温玫谨Lighthearted

问题背景

在使用FerretDB v1.24.0版本时，用户发现当集合中包含超过100万文档时，通过ObjectID查询单个文档的性能表现不佳，查询耗时超过10秒。经过分析，发现PostgreSQL后端生成的SQL查询没有利用已创建的索引，而是进行了全表扫描。

FerretDB在PostgreSQL后端默认会为每个集合的_id字段创建如下形式的B树索引：

CREATE UNIQUE INDEX IF NOT EXISTS coll_name__id_idx
    ON mongo_db_name.coll_name USING btree
    ((_jsonb -> '_id'::text) ASC NULLS LAST);

当执行MongoDB查询如：

db.coll_name.find({"_id": ObjectId("605495978582350001815f10")})

FerretDB会将其转换为PostgreSQL查询：

SELECT _jsonb FROM "mongo_db_name"."coll_name" WHERE _jsonb->$1 @> $2

关键问题在于PostgreSQL的@>操作符（包含操作符）无法利用标准的B树索引。这个操作符需要特定的GIN索引才能被优化器识别和使用。

用户发现手动创建以下GIN索引可以显著提高查询性能：

CREATE INDEX test_id_gin ON mongo_db_name.coll_name USING gin ((_jsonb -> '_id'));

这个问题不仅限于_id字段，其他字段的查询也存在类似情况。对于任何使用@>操作符的JSONB查询，都需要GIN索引才能获得最佳性能。

PostgreSQL为JSONB数据提供了几种索引选项：

FerretDB v1.x版本默认创建B树索引的策略在某些查询场景下不够优化，特别是对于MongoDB查询模式转换为PostgreSQL的JSONB包含操作时。

这个问题在FerretDB v2.0.0-rc.1及后续版本中已得到解决。新版本改进了索引创建策略，能够更好地适应各种查询模式。

对于仍在使用v1.x版本的用户：

对于JSONB数据的高效查询，GIN索引通常能提供更好的性能，特别是在处理复杂查询条件时。

登录后查看全文