Microsoft DocumentDB 中 PostgreSQL 15 版本下 BSON 库的内存对齐问题解析

2025-07-10 15:15:56作者：江焘钦

问题背景

在使用 Microsoft DocumentDB 与 PostgreSQL 15 版本集成时，开发团队遇到了一个棘手的内存对齐问题。这个问题表现为在使用 BSON 库时出现 SIGSEGV 段错误，经过深入调查发现根源在于 PostgreSQL 15 及以下版本的内存分配机制与 BSON 库的内存对齐要求存在冲突。

技术细节分析

内存对齐的重要性

内存对齐是计算机系统中一个基础但至关重要的概念。现代 CPU 访问内存时，通常要求数据按照特定的边界对齐（如 4 字节、8 字节或 16 字节边界）。当数据没有正确对齐时，会导致性能下降甚至程序崩溃。

PostgreSQL 15 的内存分配问题

在 PostgreSQL 15 及更早版本中，pg_aligned_alloc 函数实际上并没有实现真正的内存对齐分配。这个函数虽然名义上承诺提供对齐的内存分配，但在底层实现上存在缺陷，无法满足某些库对内存对齐的严格要求。

BSON 库的特殊要求

BSON (Binary JSON) 是一种二进制编码的文档格式，它对内存对齐有严格要求。BSON 库内部的数据结构和操作都假设内存是按照特定方式对齐的。当这种假设被破坏时，就会导致各种难以诊断的错误，包括段错误(SIGSEGV)。

问题影响范围

这个问题影响所有在 PostgreSQL 15 及以下版本上运行 Microsoft DocumentDB 的环境，且与操作系统和硬件架构无关。这意味着无论用户使用的是 Linux、Windows 还是 macOS，在 x86 或 ARM 架构上，都可能遇到这个问题。

解决方案

开发团队发现了两种可行的解决方案：

编译时解决方案：在构建 BSON 库时添加 -DENABLE_EXTRA_ALIGNMENT=OFF 编译选项。这个选项会禁用 BSON 库对额外内存对齐的严格要求，使其能够适应 PostgreSQL 15 的内存分配行为。
升级方案：升级到 PostgreSQL 16 或更高版本，因为这些版本已经修复了 pg_aligned_alloc 的实现问题，能够提供真正的对齐内存分配。