pg_duckdb插件中临时表扫描导致服务器崩溃问题分析

2025-07-03 22:08:21作者：田桥桑Industrious

问题背景

在PostgreSQL数据库中使用pg_duckdb扩展插件时，当执行包含聚合函数和条件过滤的查询操作时，服务器会出现崩溃现象。这个问题特别容易在查询临时表且数据量超过2048条记录时触发。

问题现象

用户在执行如下SQL查询时遇到了服务器崩溃：

create temp table t2(a int);
insert into t2 select i from generate_series(1, 200000) as i;
select count(*), sum(a), count(*) = 100000 from t2 where a%2 = 0;

技术分析

根本原因

该问题的根本原因在于内存上下文管理不当。pg_duckdb插件在处理表扫描时，会在自定义的内存上下文duckdb_scan_memory_ctx中执行操作。这个内存上下文会在每次处理完2048条记录（STANDARD_VECTOR_SIZE）后被重置。

问题出在顺序扫描(SeqScan)的初始化阶段。当扫描不是并行执行时，TableScanDesc结构体会在第一次调用SeqNext()函数时被创建。然而，这个结构体被分配在了会被定期重置的内存上下文中，导致后续访问时出现内存错误。

详细过程

查询执行开始时，PostgreSQL会初始化顺序扫描操作
第一次调用SeqNext()函数时，会创建TableScanDesc结构体
这个结构体被分配在duckdb_scan_memory_ctx内存上下文中
当处理完2048条记录后，插件会重置这个内存上下文
后续访问TableScanDesc时，由于它已经被释放，导致段错误

临时表的特殊性

这个问题在临时表上更容易出现，因为PostgreSQL默认不会对临时表使用并行扫描。对于普通表，系统可能会选择并行扫描，而并行扫描的初始化路径不同，不会出现这个问题。

解决方案

修复这个问题的关键在于确保TableScanDesc结构体被分配在一个不会被重置的内存上下文中。具体可以采取以下方法之一：

将TableScanDesc的分配移到更持久的内存上下文中
在重置内存上下文前，确保保存所有必要的扫描状态
修改内存管理策略，不重置包含关键数据结构的内存上下文

预防措施

对于插件开发者来说，在处理内存上下文时需要特别注意：

明确每个内存上下文的生命周期
关键数据结构应该分配在适当生命周期的上下文中
在重置内存上下文前，确保没有重要的数据结构会被释放
对于跨多个函数调用的状态，要特别小心其内存管理

总结

这个崩溃问题展示了在PostgreSQL插件开发中内存管理的重要性。特别是在混合使用PostgreSQL原生执行器和自定义执行逻辑时，需要特别注意内存上下文的切换和管理。通过正确理解和使用内存上下文，可以避免类似的崩溃问题。

pg_duckdb

DuckDB-powered Postgres for high performance apps & analytics.

项目地址：https://gitcode.com/GitHub_Trending/pg/pg_duckdb

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

338

185

agent-studio

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

openGauss kernel ~ openGauss is an open source relational database management system

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

Python

114

140