OrioleDB在大规模pgbench初始化时主键构建卡住问题分析

2025-06-24 08:10:14作者：郁楠烈Hubert

OrioleDB – building a modern cloud-native storage engine (... and solving some PostgreSQL wicked problems) 🇺🇦

项目地址：https://gitcode.com/gh_mirrors/or/orioledb

问题现象

在使用OrioleDB作为默认存储引擎的PostgreSQL环境中，当执行大规模pgbench初始化测试时（scale factor设置为2000），系统在"creating primary keys..."阶段出现卡死现象。具体表现为创建索引操作无法完成，而小规模测试（scale factor在50-500之间）则能顺利完成。

环境配置

问题复现环境使用了以下关键配置：

共享预加载库设置为orioledb
OrioleDB主缓冲区配置为20GB
默认表访问方法设置为orioledb
最大并行维护工作进程设置为35
同步提交和fsync均关闭
工作内存设置为10MB
最大WAL大小设置为5GB

技术分析

从堆栈跟踪来看，系统在创建主键时卡在了锁等待环节。具体表现为：

进程在等待锁时进入了epoll_wait状态
锁等待涉及OrioleDB的内部表关系锁（o_tables_rel_lock_extended_no_inval）
该操作是在事务提交时的undo栈处理过程中触发的

问题本质

这个问题揭示了OrioleDB在大规模数据处理时的一个潜在瓶颈：当处理大量数据时，事务提交过程中的undo处理可能与其他系统操作（如锁获取）产生交互问题，导致系统陷入等待状态。

解决方案

项目维护者通过提交修复了这个问题。修复的核心思路可能是优化了OrioleDB在事务提交时的undo处理流程，特别是对系统表锁的获取方式进行了改进，避免了在大规模操作时的锁等待问题。

经验总结

大规模数据库操作需要特别注意锁机制的设计，避免长时间锁等待
存储引擎的undo处理流程需要与核心数据库操作良好配合
性能测试时，不同规模的数据集可能暴露出不同的问题
对于新兴的存储引擎如OrioleDB，在大规模应用前需要进行充分的压力测试

这个问题及其解决方案为使用OrioleDB进行大规模数据处理提供了宝贵的实践经验，也展示了开源社区快速响应和解决问题的能力。

OrioleDB – building a modern cloud-native storage engine (... and solving some PostgreSQL wicked problems) 🇺🇦

项目地址：https://gitcode.com/gh_mirrors/or/orioledb

登录后查看全文

项目优选

收起

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

昇腾LLM分布式训练框架

ohos_react_native

React Native鸿蒙化仓库

flutter_flutter

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

AscendNPU-IR是基于MLIR（Multi-Level Intermediate Representation）构建的，面向昇腾亲和算子编译时使用的中间表示，提供昇腾完备表达能力，通过编译优化提升昇腾AI处理器计算效率，支持通过生态框架使能昇腾AI处理器与深度调优