pgvecto.rs 项目中分区表向量索引统计视图的问题分析

2025-07-05 09:37:01作者：郁楠烈Hubert

在 PostgreSQL 扩展 pgvecto.rs 的使用过程中，开发者发现了一个关于分区表向量索引统计视图的重要问题。本文将深入分析该问题的技术背景、产生原因以及解决方案。

问题现象

当用户对分区表创建向量索引后，查询系统视图 pg_vector_index_stat 时会遇到错误提示："The index is not existing in the background worker"。这一现象在标准表上不会出现，仅发生在分区表场景中。

技术背景

pgvecto.rs 是 PostgreSQL 的一个扩展，提供了高效的向量搜索功能。在 PostgreSQL 的分区表实现中，每个分区实际上是独立的物理表，但通过分区表机制逻辑上组合在一起。当在分区表上创建索引时，PostgreSQL 会在每个分区上分别创建实际的索引对象。

问题根源

经过分析，该问题源于 pg_vector_index_stat 视图的定义方式。原视图查询时没有正确处理分区表的特殊情况，导致：

视图尝试查询分区表父表的索引统计信息，但实际上向量索引只存在于各个子分区上
视图过滤条件不足，没有排除掉分区表父表这类特殊关系类型

解决方案

针对此问题，pgvecto.rs 开发者提供了两种解决方案：

对于 v0.2.1 版本

CREATE OR REPLACE VIEW pg_vector_index_stat AS
    SELECT
        C.oid AS tablerelid,
        I.oid AS indexrelid,
        C.relname AS tablename,
        I.relname AS indexname,
        (_vectors_index_stat(I.relfilenode)).*
    FROM pg_class C JOIN
         pg_index X ON C.oid = X.indrelid JOIN
         pg_class I ON I.oid = X.indexrelid JOIN
         pg_am A ON A.oid = I.relam
    WHERE A.amname = 'vectors' AND C.relkind = 'r';

对于开发版本

CREATE OR REPLACE VIEW pg_vector_index_stat AS
    SELECT
        C.oid AS tablerelid,
        I.oid AS indexrelid,
        C.relname AS tablename,
        I.relname AS indexname,
        (_vectors_index_stat(I.oid)).*
    FROM pg_class C JOIN
         pg_index X ON C.oid = X.indrelid JOIN
         pg_class I ON I.oid = X.indexrelid JOIN
         pg_am A ON A.oid = I.relam
    WHERE A.amname = 'vectors' AND C.relkind = 'r';

两个方案的核心改进都是添加了 C.relkind = 'r' 条件，确保只查询普通表（不包括分区父表等特殊关系类型）。

实际应用建议

对于使用 pgvecto.rs 的开发人员，在处理分区表向量索引时：

如果需要查询全部分区索引统计，应该分别查询每个子分区的索引
可以等待官方发布包含此修复的新版本
临时应用上述视图修改方案时，需注意与当前版本的兼容性

这个问题预计将在 pgvecto.rs 的下一个版本中得到正式修复，届时用户将无需手动修改视图定义即可正常使用分区表向量索引统计功能。

pgvecto.rs

Scalable, Low-latency and Hybrid-enabled Vector Search in Postgres. Revolutionize Vector Search, not Database.

项目地址：https://gitcode.com/gh_mirrors/pg/pgvecto.rs

登录后查看全文