AFL++中的tmin优化：引入del_len选项提升最小化速度

2025-06-06 17:30:09作者：邵娇湘

The fuzzer afl++ is afl with community patches, qemu 5.1 upgrade, collision-free coverage, enhanced laf-intel & redqueen, AFLfast++ power schedules, MOpt mutators, unicorn_mode, and a lot more!

项目地址：https://gitcode.com/gh_mirrors/af/AFLplusplus

背景介绍

AFL++是一个广受欢迎的模糊测试工具，其中的tmin（测试用例最小化）阶段负责将触发崩溃的测试用例缩减到最小规模，以便于后续分析和调试。在tmin过程中，block deletion（块删除）是一个关键但耗时的操作，其执行时间与输入文件的大小直接相关。

当前实现的问题

在当前的AFL++实现中，块删除操作使用了一个逐步减小的del_len参数来控制删除的粒度。这个参数初始值较大，随着最小化过程的进行，会按照2的幂次逐步减小，直到达到最小值1。这种设计虽然能够实现较为彻底的最小化，但在某些场景下可能造成不必要的性能开销。

具体来说，当处理大型输入文件时：

初始阶段使用较大的del_len可以快速删除大块数据
但随着del_len减小到1，算法需要逐个字节地尝试删除，这会显著增加处理时间
在某些对速度要求高于最小化精度的场景下，这种细粒度的操作显得效率不足

优化方案

针对上述问题，我们提出以下优化方案：

引入可配置的del_len选项：允许用户指定del_len的最小值，在速度和最小化精度之间取得平衡。例如，设置最小del_len为4可以跳过单字节级别的删除尝试，显著提升处理速度。
智能终止机制：当连续多次删除尝试都无法进一步缩减文件大小时，可以提前终止最小化过程。具体可以：
- 设置当连续n次尝试缩减量小于m字节时终止
- 或者当单次循环中没有任何缩减时立即终止

技术实现考量

在实现这些优化时，需要考虑以下技术细节：

默认行为保持兼容：保持当前1字节最小粒度的默认行为，确保不影响现有用户的使用体验。
参数命名清晰：新增的命令行参数应该具有自解释性，如--min-del-len或--fast-minimize。
性能与效果的平衡：提供文档说明不同参数设置对速度和最小化效果的影响，帮助用户做出合理选择。
渐进式优化：可以先实现基本的del_len配置选项，后续再添加更智能的终止机制。

实际应用价值

这项优化对于以下场景特别有价值：

大规模模糊测试：当处理大量崩溃用例时，快速最小化可以显著提升整体效率。
大型输入文件：对于MB级别的大文件，细粒度最小化的时间成本可能不成比例。
CI/CD流水线：在自动化测试环境中，往往更关注快速反馈而非绝对最小化。

总结

通过为AFL++的tmin阶段引入可配置的del_len选项，我们可以在保持核心功能的同时，为用户提供更大的灵活性，在最小化精度和处理速度之间做出适合自己需求的选择。这种优化体现了工程实践中常见的trade-off思想，也展示了开源项目通过社区贡献不断完善的典型过程。

The fuzzer afl++ is afl with community patches, qemu 5.1 upgrade, collision-free coverage, enhanced laf-intel & redqueen, AFLfast++ power schedules, MOpt mutators, unicorn_mode, and a lot more!

项目地址：https://gitcode.com/gh_mirrors/af/AFLplusplus

登录后查看全文

项目优选

收起

deepin linux kernel

Ascend Extension for PyTorch

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件，通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求，让密码技术应用更简单，同时探索后量子等先进算法创新实践，构建密码前沿技术底座！

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

昇腾LLM分布式训练框架

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

flutter_flutter