AFL++中afl-cmin.py工具处理目标程序崩溃时的缓冲区优化

2025-06-06 16:24:44作者：段琳惟

The fuzzer afl++ is afl with community patches, qemu 5.1 upgrade, collision-free coverage, enhanced laf-intel & redqueen, AFLfast++ power schedules, MOpt mutators, unicorn_mode, and a lot more!

项目地址：https://gitcode.com/gh_mirrors/af/AFLplusplus

在AFL++模糊测试框架中，afl-cmin.py是一个用于精简语料库的重要工具。近期发现当目标程序在获取AFL_MAP_SIZE时发生崩溃，会导致工具无法正确读取输出结果的问题。本文将深入分析该问题的成因及解决方案。

问题现象

当目标程序被编译了ASan（AddressSanitizer）且设置了AFL_DUMP_MAP_SIZE=1环境变量时，如果程序崩溃退出，afl-cmin.py工具会抛出ValueError异常，提示无法将空字节串转换为整数。这是因为工具需要从目标程序的stdout中读取AFL_MAP_SIZE值，但当程序异常终止时，缓冲区内容可能未被刷新。

技术分析

问题的根本原因在于标准输出的行缓冲机制。在正常情况下，当程序输出内容时：

如果输出包含换行符，内容会立即刷新
如果程序正常退出，缓冲区会自动刷新
但当程序异常终止（如被ASan检测到错误），缓冲内容可能丢失

在AFL++的实现中，afl-compiler-rt.o.c会在启动时打印MAP_SIZE值，但未显式调用fflush(stdout)。当程序随后崩溃时，这个值可能仍在缓冲区中未被输出。

解决方案

针对此问题，我们采用了双重保障措施：

在编译器运行时中添加fflush调用：确保MAP_SIZE值立即输出，不受程序后续行为影响
在afl-cmin.py中禁用输出缓冲：通过stdbuf工具强制禁用stdout和stderr的缓冲

具体到afl-cmin.py的修改，主要调整了子进程执行部分的代码，添加了stdbuf包装：

result = subprocess.run(
    ["stdbuf", "-o0", "-e0", args.exe], 
    capture_output=True, 
    text=True,
    env={"AFL_DUMP_MAP_SIZE": "1"}
)

同时，对于ASan编译的目标程序，建议设置ASAN_OPTIONS=detect_leaks=0以避免泄漏检测导致的提前终止。

实际效果

修改后，即使目标程序崩溃，afl-cmin.py也能正确获取MAP_SIZE值：

9666860
AddressSanitizer:DEADLYSIGNAL
=================================================================
==2210990==ERROR: AddressSanitizer: SEGV on unknown address...

工具随后可以正常完成语料库精简工作。

最佳实践建议

对于使用AFL++进行模糊测试的开发人员，建议：

更新到包含此修复的最新版本
对于可能崩溃的目标程序，考虑使用AFL_SKIP_CRASHES=1选项
对于ASan编译的目标，添加ASAN_OPTIONS=detect_leaks=0环境变量
定期检查工具链更新，获取最新的稳定性改进

这一改进显著提升了afl-cmin.py在复杂场景下的稳定性，特别是在处理带有内存错误检测的目标程序时，确保了语料库精简过程的可靠性。

AFLplusplus