WAMR项目中多线程内存访问越界问题的分析与解决

2025-06-08 20:36:55作者：虞亚竹Luna

问题背景

在Wasm Micro Runtime (WAMR)项目中，开发者在使用多线程功能时遇到了一个棘手的问题：当Wasm应用中创建多个线程并频繁进行内存分配/释放操作时，系统会随机出现"out of bounds memory access"错误。这个问题特别容易在以下场景触发：

主线程创建两个工作线程（一个HTTP服务器线程和一个WebSocket客户端线程）
线程中使用了jsoncpp库进行JSON数据解析
频繁调用wasm_runtime_module_malloc和wasm_runtime_module_free函数

问题现象

错误表现为随机出现的越界内存访问，通常在正常运行几次或十几次后发生。通过调试发现：

单纯在主线程中循环调用malloc/free 6000次不会崩溃
当工作线程收到数据并进行JSON解析时必定崩溃
如果只是简单打印日志而不进行JSON解析则不会崩溃

根本原因分析

经过深入排查，发现问题的根源在于内存分配机制的线程安全性问题：

WASI SDK的dlmalloc问题：默认情况下，WASI SDK中的libc.a包含了dlmalloc.o，这个内存分配器在多线程环境下存在线程安全问题。
两种线程模型冲突：项目中同时启用了WAMR的lib-pthread和WASI线程支持（DWAMR_BUILD_LIB_WASI_THREADS=1），导致线程管理混乱。
堆栈大小限制：默认的线程堆栈大小可能不足，特别是在进行复杂操作（如JSON解析）时。

解决方案

经过多次试验，最终确定了以下解决方案：

1. 移除dlmalloc.o

从WASI SDK的libc.a中移除dlmalloc.o，强制使用WAMR的内存分配器：

ar d libc.a dlmalloc.o

2. 调整编译选项

修改CMake配置，禁用WASI线程支持，仅使用WAMR的lib-pthread：

-DWAMR_BUILD_LIB_PTHREAD=1 
-DWAMR_BUILD_LIB_WASI_THREADS=0

3. 增加堆栈大小

在链接选项中增加线程堆栈大小：

LINKER:-zstack-size=20971520

4. 设置最大线程数

在运行时设置合理的最大线程数：

wasm_runtime_set_max_thread_num(4);

5. 导出必要符号

确保正确导出Wasm构造函数：

LINKER:--export=__wasm_call_ctors

并在调用init()前先调用它：

wasm_function_inst_t call_ctors_func = wasm_runtime_lookup(module_inst, "__wasm_call_ctors");
wasm_runtime_call_wasm(exec_env, call_ctors_func, 0, NULL);

技术要点总结

线程模型选择：WAMR提供了两种线程实现方式 - lib-pthread和WASI线程。在大多数情况下，推荐使用lib-pthread，因为它更成熟稳定。
内存分配安全：在多线程环境中，必须确保内存分配器是线程安全的。WAMR的内存分配器经过专门优化，适合多线程场景。
资源限制：Wasm应用的线程堆栈和内存限制需要根据实际需求合理设置，特别是当应用需要进行复杂操作（如JSON解析）时。
初始化顺序：C++应用的全局对象初始化需要通过__wasm_call_ctors完成，必须在主逻辑前调用。

最佳实践建议

对于多线程Wasm应用，建议：
- 使用WAMR的lib-pthread而非WASI线程
- 移除WASI SDK中的dlmalloc.o
- 设置足够的堆栈和内存空间
调试技巧：
- 使用wasm_runtime_set_max_thread_num限制线程数量
- 逐步增加线程功能，定位问题点
- 关注线程间共享数据的访问安全
性能考量：
- 合理规划线程数量
- 避免频繁的内存分配/释放
- 考虑使用内存池技术

通过以上措施，开发者可以构建稳定可靠的多线程Wasm应用，充分发挥WAMR的高性能特性。

wasm-micro-runtime

WebAssembly Micro Runtime (WAMR)

项目地址：https://gitcode.com/gh_mirrors/wa/wasm-micro-runtime

登录后查看全文

WAMR项目中多线程内存访问越界问题的分析与解决

问题背景

问题现象

根本原因分析

解决方案

1. 移除dlmalloc.o

2. 调整编译选项

3. 增加堆栈大小

4. 设置最大线程数

5. 导出必要符号

技术要点总结

最佳实践建议

最新内容推荐

项目优选

WAMR项目中多线程内存访问越界问题的分析与解决

问题背景

问题现象

根本原因分析

解决方案

1. 移除dlmalloc.o

2. 调整编译选项

3. 增加堆栈大小

4. 设置最大线程数

5. 导出必要符号

技术要点总结

最佳实践建议

相关内容推荐

最新内容推荐

项目优选