AFLplusplus中afl-clang-fast转换bitcode到ELF失败问题分析

2025-06-06 08:37:33作者：凌朦慧Richard

项目地址：https://gitcode.com/gh_mirrors/afl/AFLplusplus

问题背景

在使用AFLplusplus的afl-clang-fast工具链时，开发者尝试将LLVM bitcode转换为可执行ELF文件时遇到了问题。具体表现为在链接阶段出现符号冲突或缺失，导致编译失败。这个问题在不同版本的LLVM（从10到17）中都存在，但表现略有差异。

问题现象

当开发者使用以下命令序列时会出现问题：

首先使用afl-clang-fast生成bitcode：

afl-clang-fast -c -emit-llvm -o test.bc test.c

然后尝试将bitcode转换为可执行文件：

afl-clang-fast -o test_elf test.bc

在LLVM 17环境下，会出现断言失败错误，提示sancov.module_ctor_trace_pc_guard相关符号问题。而在LLVM 10环境下，错误信息更明确，显示链接器找不到__start___sancov_guards和__stop___sancov_guards等符号定义。

根本原因

问题的核心在于afl-clang-fast的工作机制。当第二次使用afl-clang-fast链接bitcode时，工具会尝试再次进行插桩操作，这导致了以下问题：

重复插桩：第一次编译生成bitcode时已经插入了SanitizerCoverage相关代码，第二次链接时又尝试插入相同的插桩代码，造成符号冲突。
符号重复定义：特别是sancov.module_ctor_trace_pc_guard等构造函数相关符号会被多次定义。
运行时支持缺失：SanitizerCoverage需要特定的运行时支持，直接链接bitcode时这些支持没有被正确包含。

解决方案

正确的做法是避免让afl-clang-fast进行二次插桩。可以采用以下任一方法：

使用普通clang链接：

clang -o test_elf test.bc /path/to/afl-compiler-rt.o

分步编译：

# 生成目标文件
afl-clang-fast -c -o test.o test.c
# 直接链接
afl-clang-fast -o test_elf test.o

技术细节

AFL++的插桩过程实际上分为几个关键步骤：

前端插桩：通过LLVM pass在IR层面插入覆盖率跟踪代码
运行时支持：链接afl-compiler-rt.o提供必要的运行时函数
构造函数注册：通过module构造函数确保插桩代码在程序启动时初始化

当重复插桩时，这些机制会互相干扰，特别是构造函数相关的符号会冲突。这也是为什么在LLVM 17中会直接触发断言失败，而在较早版本中表现为链接错误。

最佳实践建议

对于需要处理bitcode的工作流，建议明确区分插桩阶段和链接阶段
如果需要多次处理bitcode，考虑使用LLVM的opt工具手动控制pass的应用
保持AFL++版本更新，新版通常会修复这类兼容性问题
对于复杂项目，考虑使用AFL++的LTO（链接时优化）模式，它可以更好地处理整个程序的插桩

理解这些底层机制有助于开发者更有效地使用AFL++进行模糊测试，特别是在需要自定义插桩或处理bitcode的场景下。

AFLplusplus

项目地址：https://gitcode.com/gh_mirrors/afl/AFLplusplus

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

MindSpeed-MM

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。