AFLplusplus中afl-clang-fast转换bitcode到ELF失败问题分析
问题背景
在使用AFLplusplus的afl-clang-fast工具链时,开发者尝试将LLVM bitcode转换为可执行ELF文件时遇到了问题。具体表现为在链接阶段出现符号冲突或缺失,导致编译失败。这个问题在不同版本的LLVM(从10到17)中都存在,但表现略有差异。
问题现象
当开发者使用以下命令序列时会出现问题:
- 首先使用afl-clang-fast生成bitcode:
afl-clang-fast -c -emit-llvm -o test.bc test.c
- 然后尝试将bitcode转换为可执行文件:
afl-clang-fast -o test_elf test.bc
在LLVM 17环境下,会出现断言失败错误,提示sancov.module_ctor_trace_pc_guard相关符号问题。而在LLVM 10环境下,错误信息更明确,显示链接器找不到__start___sancov_guards和__stop___sancov_guards等符号定义。
根本原因
问题的核心在于afl-clang-fast的工作机制。当第二次使用afl-clang-fast链接bitcode时,工具会尝试再次进行插桩操作,这导致了以下问题:
-
重复插桩:第一次编译生成bitcode时已经插入了SanitizerCoverage相关代码,第二次链接时又尝试插入相同的插桩代码,造成符号冲突。
-
符号重复定义:特别是
sancov.module_ctor_trace_pc_guard等构造函数相关符号会被多次定义。 -
运行时支持缺失:SanitizerCoverage需要特定的运行时支持,直接链接bitcode时这些支持没有被正确包含。
解决方案
正确的做法是避免让afl-clang-fast进行二次插桩。可以采用以下任一方法:
- 使用普通clang链接:
clang -o test_elf test.bc /path/to/afl-compiler-rt.o
- 分步编译:
# 生成目标文件
afl-clang-fast -c -o test.o test.c
# 直接链接
afl-clang-fast -o test_elf test.o
技术细节
AFL++的插桩过程实际上分为几个关键步骤:
- 前端插桩:通过LLVM pass在IR层面插入覆盖率跟踪代码
- 运行时支持:链接afl-compiler-rt.o提供必要的运行时函数
- 构造函数注册:通过module构造函数确保插桩代码在程序启动时初始化
当重复插桩时,这些机制会互相干扰,特别是构造函数相关的符号会冲突。这也是为什么在LLVM 17中会直接触发断言失败,而在较早版本中表现为链接错误。
最佳实践建议
- 对于需要处理bitcode的工作流,建议明确区分插桩阶段和链接阶段
- 如果需要多次处理bitcode,考虑使用LLVM的opt工具手动控制pass的应用
- 保持AFL++版本更新,新版通常会修复这类兼容性问题
- 对于复杂项目,考虑使用AFL++的LTO(链接时优化)模式,它可以更好地处理整个程序的插桩
理解这些底层机制有助于开发者更有效地使用AFL++进行模糊测试,特别是在需要自定义插桩或处理bitcode的场景下。
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust0213
cann-learning-hubCANN 学习中心仓,支持在线互动运行、边学边练,提供教程、示例与优化方案,一站式助力昇腾开发者快速上手。Jupyter Notebook0137
JoyAI-EchoJoyAI-Echo,这是一个独立的、仅用于推理的版本,旨在实现分钟级多镜头音视频生成。它采用了经过蒸馏的DMD生成器、配对的跨模态记忆以及故事级别的一致性。其性能的核心在于,一个跨模态视听记忆库能够在长达五分钟的视频中保持角色外观和语音音色的一致性。同时,一个训练后处理流程将基于记忆的强化学习与分布匹配蒸馏相结合,实现了7.5倍的速度提升,显著增强了视觉质量和对齐效果。00
GLM-5.2智谱开源 GLM-5.2,这是针对长文本任务的最新旗舰模型。相较于前代产品 GLM-5.1,它在长文本任务处理能力上实现了显著飞跃,并且首次在稳定的 100 万 token 上下文中提供这一能力。Jinja00
SwanLab⚡️SwanLab - an open-source, modern-design AI training tracking and visualization tool. Supports Cloud / Self-hosted use. Integrated with PyTorch / Transformers / LLaMA Factory / veRL/ Swift / Ultralytics / MMEngine / Keras etc.Python00
tiny-universe《大模型白盒子构建指南》:一个全手搓的Tiny-UniverseJupyter Notebook03