OrioleDB 在 MacOS 上的回归测试崩溃问题分析

2025-06-24 22:15:22作者：舒璇辛Bertina

OrioleDB – building a modern cloud-native storage engine (... and solving some PostgreSQL wicked problems) 🇺🇦

项目地址：https://gitcode.com/gh_mirrors/or/orioledb

问题背景

OrioleDB 是一个基于 PostgreSQL 的新型存储引擎，旨在提供更高的性能和更低的延迟。在最近的开发过程中，开发者在 MacOS 系统上运行回归测试时遇到了崩溃问题。这个问题出现在执行 make USE_PGXS=1 IS_DEV=1 regresscheck 命令时，导致多个测试用例失败。

崩溃现象

从测试输出可以看到，前12个测试用例执行正常，但从第13个测试用例"index_bridging"开始，后续多个测试用例都因进程退出代码2而失败。崩溃时的调用栈显示，问题发生在异常处理过程中，具体是在 o_rewrite_cleanup 函数中尝试释放内存时触发了断言失败。

技术分析

根据调用栈信息，崩溃发生在以下关键路径：

系统调用了 pthread_kill 发送终止信号
PostgreSQL 的 ExceptionalCondition 被触发，表明遇到了异常条件
调用链经过 list_free_deep → o_rewrite_cleanup → orioledb_error_cleanup_hook
最终在事务中止过程中崩溃

这表明问题可能出现在 OrioleDB 的错误清理钩子函数中，特别是在处理DDL(数据定义语言)操作的内存释放时。o_rewrite_cleanup 函数负责在DDL操作失败或中止时清理相关资源，而在这个场景下，它尝试释放一个可能已经被释放或无效的列表结构。

根本原因

经过深入分析，这个问题可能由以下几个因素共同导致：

内存管理问题：在错误处理路径中，存在对已释放内存的二次释放风险
异常处理顺序问题：PostgreSQL 的事务中止机制与 OrioleDB 的清理钩子之间可能存在执行顺序不当
平台差异：MacOS 的内存管理行为可能与Linux有所不同，导致在Linux上隐藏的问题在MacOS上暴露

解决方案

针对这类问题，通常需要采取以下措施：

加强内存管理：在清理函数中添加对指针有效性的检查
完善错误处理：确保在错误路径上所有资源都能被正确释放且只释放一次
平台兼容性测试：增加对MacOS等不同平台的持续集成测试
防御性编程：在关键路径上添加更多的断言和状态检查

经验教训

这个案例提醒我们：

跨平台开发时，不能假设所有平台的内存管理行为一致
错误处理路径需要与正常路径一样被仔细设计和测试
数据库扩展开发中，与核心事务管理的集成点需要特别关注
断言失败虽然会导致崩溃，但能帮助及早发现潜在问题，是质量保障的重要手段

结论

OrioleDB 在MacOS上的回归测试崩溃问题揭示了在错误处理路径上的内存管理缺陷。通过分析调用栈和代码逻辑，开发团队能够定位并修复这类平台特定的问题。这也强调了在数据库系统开发中，全面测试和防御性编程的重要性，特别是在与核心数据库引擎交互的关键路径上。

OrioleDB – building a modern cloud-native storage engine (... and solving some PostgreSQL wicked problems) 🇺🇦

项目地址：https://gitcode.com/gh_mirrors/or/orioledb

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

ohos_react_native

React Native鸿蒙化仓库

flutter_flutter

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

本项目是CANN开源社区的核心管理仓库，包含社区的治理章程、治理组织、通用操作指引及流程规范等基础信息