AFLplusplus项目中CmpLog模块的内存对齐问题分析与修复

2025-06-06 06:14:01作者：魏侃纯Zoe

The fuzzer afl++ is afl with community patches, qemu 5.1 upgrade, collision-free coverage, enhanced laf-intel & redqueen, AFLfast++ power schedules, MOpt mutators, unicorn_mode, and a lot more!

项目地址：https://gitcode.com/gh_mirrors/af/AFLplusplus

问题背景

在AFLplusplus项目的CmpLog模块中，开发团队发现了一个潜在的内存对齐问题。这个问题源于代码中对内存的非对齐访问，虽然在x86和aarch64架构下可能正常工作（取决于具体配置），但在其他架构上会导致程序异常终止。

技术细节分析

内存对齐是计算机系统中的一个重要概念，指的是数据在内存中的存储地址应该是其大小的整数倍。例如，64位(8字节)数据最好存储在8字节对齐的地址上。非对齐访问在某些架构上会导致性能下降，甚至引发硬件异常。

在AFLplusplus的CmpLog实现中，问题主要表现在两个方面：

在插桩(instrumentation)过程中存在非对齐内存访问
在afl-fuzz核心逻辑中也存在同样问题

具体来说，cmp_operands结构体的定义存在对齐问题。原始定义虽然使用了__attribute__((packed))来取消编译器自动填充，但结构体成员的大小和排列方式可能导致后续访问时的非对齐问题。

解决方案

开发团队提出了两种解决方案：

填充结构体使其大小为64位的倍数：这是更直接的解决方案，通过调整结构体成员的顺序和添加适当的填充字段，确保整个结构体的大小和对齐方式符合要求。
逐字节访问结构体成员：这种方法虽然速度较慢，但可以避免任何对齐问题，同时可能更节省内存。

最终实现采用了第一种方案，对结构体进行了重新设计：

struct cmp_operands {
  u64 v0;
  u64 v0_128;
  u64 v0_256_0;  // 为未来u256类型预留
  u64 v0_256_1;
  u64 v1;
  u64 v1_128;
  u64 v1_256_0;
  u64 v1_256_1;
  u8 unused[8];
} __attribute__((packed));

同时，相关的cmpfn_operands结构体也进行了类似的调整，确保所有结构体的大小都是72字节，满足对齐要求。

修复意义

这次修复虽然看似只是调整了几个结构体成员的顺序和添加了填充字段，但实际上解决了潜在的严重问题：

跨平台兼容性：确保AFLplusplus可以在更多架构上稳定运行
代码健壮性：消除了未定义行为(UB)的风险
未来可扩展性：为将来可能添加的256位比较操作预留了空间

总结

内存对齐问题是系统级编程中常见但容易被忽视的问题。AFLplusplus团队通过这次修复，不仅解决了当前的问题，还提高了代码的质量和可维护性。这也提醒开发者在进行底层编程时，特别是在涉及跨平台开发时，需要特别注意内存对齐问题。

AFLplusplus

The fuzzer afl++ is afl with community patches, qemu 5.1 upgrade, collision-free coverage, enhanced laf-intel & redqueen, AFLfast++ power schedules, MOpt mutators, unicorn_mode, and a lot more!

项目地址：https://gitcode.com/gh_mirrors/af/AFLplusplus

登录后查看全文

项目优选

收起

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

360

219

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

AscendNPU-IR是基于MLIR（Multi-Level Intermediate Representation）构建的，面向昇腾亲和算子编译时使用的中间表示，提供昇腾完备表达能力，通过编译优化提升昇腾AI处理器计算效率，支持通过生态框架使能昇腾AI处理器与深度调优

C++

161