syzkaller项目中executor内存分配问题的分析与解决

2025-06-06 07:14:53作者：凌朦慧Richard

问题背景

在syzkaller项目的测试过程中，开发团队发现了一个间歇性出现的错误。该错误表现为在执行简单程序时出现内存分配失败，具体错误信息为"malloc assertion failure in sysmalloc"。这个问题在GitHub CI和syzkaller的自动化测试系统syzbot中都有出现，但并非每次都能复现，属于典型的偶发性问题。

问题现象

错误发生时，系统会输出以下关键信息：

内存分配断言失败："Fatal glibc error: malloc assertion failure in sysmalloc"
文件描述符错误："Bad file descriptor"
进程异常退出状态码67

在测试用例TestFuzz中，这个问题会导致测试失败，影响项目的持续集成流程。开发团队通过增加调试输出，发现错误发生在executor进程初始化阶段。

技术分析

内存分配机制

syzkaller的executor使用了一个固定的内存地址SYZ_DATA_OFFSET(0x20000000)来映射数据段。这个地址通过mmap系统调用进行分配，使用了MAP_FIXED标志来确保映射到指定地址。

然而，在静态链接(-static)的二进制文件中，glibc的内存分配器(brk/malloc)有时会先于executor的mmap调用分配这个地址范围。这导致了以下两种错误情况：

当executor尝试mmap时，地址已被占用，返回错误"File exists"
内存分配器内部状态被破坏，导致malloc断言失败

线程创建的影响

问题还与pthread_create调用有关。即使在最简单的测试程序中，pthread库内部也会调用malloc来分配线程栈和线程本地存储(TLS)。在静态链接的二进制中，这些分配发生在executor初始化早期，可能先于数据段mmap。

解决方案探索

开发团队考虑了多种解决方案：

移除固定地址映射：改为使用mmap(0,...)让系统自动选择地址
- 优点：完全避免地址冲突
- 缺点：可能影响某些需要确定地址的测试场景
提高固定地址值：将SYZ_DATA_OFFSET从0x20000000提高到0x800000000
- 优点：保持确定性，减少冲突概率
- 缺点：不能完全杜绝冲突可能
使用静态PIE编译：在Linux上使用-static-pie选项
- 优点：保持静态链接特性，同时支持地址随机化
- 缺点：需要较新的工具链支持