Emscripten项目中mimalloc与Address Sanitizer的兼容性问题分析

2025-05-08 08:00:20作者：俞予舒Fleming

背景介绍

Emscripten是一个将C/C++代码编译为WebAssembly的工具链，在Web开发中扮演着重要角色。在内存管理方面，Emscripten提供了多种分配器选择，其中mimalloc是微软开发的高性能内存分配器。Address Sanitizer(ASan)则是Google开发的内存错误检测工具，能够检测内存泄漏、缓冲区溢出等问题。

问题现象

当在Emscripten项目中同时使用mimalloc内存分配器和Address Sanitizer时，如果程序中使用了标准库的map或unordered_map容器，并且容器大小大于1，就会出现各种运行时错误。具体表现为三种类型：

除零错误：RuntimeError: remainder by zero
内存泄漏报告：LeakSanitizer检测到内存泄漏
堆缓冲区溢出：AddressSanitizer报告heap-buffer-overflow

问题复现

通过系统性的测试矩阵，我们发现：

影响版本：Emscripten 3.1.59和3.1.74均受影响
容器类型：std::map和std::unordered_map都会出现问题
关键条件：容器大小必须大于1才会触发问题
内存分配器：仅在使用mimalloc时出现
检测工具：必须启用Address Sanitizer

技术分析

通过调试和增加断言，我们发现错误发生在mimalloc的内部释放逻辑中。具体来说，当程序尝试释放map/unordered_map占用的内存时，mimalloc的mi_page_usable_size_of函数会触发断言失败。

深入分析表明，这实际上是mimalloc与Address Sanitizer的兼容性问题。Address Sanitizer通过替换内存分配函数并在分配的内存周围添加保护区域来实现检测功能。而mimalloc也实现了自己的内存管理策略，两者同时使用时会产生冲突。

解决方案

根据mimalloc官方项目的说明，mimalloc不应该与Address Sanitizer同时使用。这是因为：

两者都会替换标准的内存分配函数
它们的内存管理策略存在根本性冲突
同时使用会导致内存布局的混乱和检测失效

对于Emscripten用户，建议的解决方案是：

如果需要内存错误检测，使用Address Sanitizer但不使用mimalloc
如果需要高性能内存分配，使用mimalloc但不启用Address Sanitizer
或者考虑使用其他与ASan兼容的内存分配器，如emmalloc或dlmalloc

最佳实践

在Emscripten项目开发中，关于内存管理和错误检测的建议：

开发阶段优先使用Address Sanitizer检测内存问题
性能优化阶段可以考虑使用mimalloc提升内存分配效率
避免同时启用可能冲突的工具和优化选项
对于容器类使用，建议进行小规模测试验证兼容性

总结

Emscripten工具链提供了强大的功能和灵活的配置选项，但不同组件之间可能存在兼容性问题。mimalloc与Address Sanitizer的冲突就是一个典型案例。理解这些工具的工作原理和限制条件，可以帮助开发者做出更合理的配置选择，避免类似问题的发生。

登录后查看全文

项目优选

收起

deepin linux kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

昇腾LLM分布式训练框架

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。