AFLplusplus中afl-clang-fast转换bitcode到ELF失败问题分析
问题背景
在使用AFLplusplus的afl-clang-fast工具链时,开发者尝试将LLVM bitcode转换为可执行ELF文件时遇到了问题。具体表现为在链接阶段出现符号冲突或缺失,导致编译失败。这个问题在不同版本的LLVM(从10到17)中都存在,但表现略有差异。
问题现象
当开发者使用以下命令序列时会出现问题:
- 首先使用afl-clang-fast生成bitcode:
afl-clang-fast -c -emit-llvm -o test.bc test.c
- 然后尝试将bitcode转换为可执行文件:
afl-clang-fast -o test_elf test.bc
在LLVM 17环境下,会出现断言失败错误,提示sancov.module_ctor_trace_pc_guard相关符号问题。而在LLVM 10环境下,错误信息更明确,显示链接器找不到__start___sancov_guards和__stop___sancov_guards等符号定义。
根本原因
问题的核心在于afl-clang-fast的工作机制。当第二次使用afl-clang-fast链接bitcode时,工具会尝试再次进行插桩操作,这导致了以下问题:
-
重复插桩:第一次编译生成bitcode时已经插入了SanitizerCoverage相关代码,第二次链接时又尝试插入相同的插桩代码,造成符号冲突。
-
符号重复定义:特别是
sancov.module_ctor_trace_pc_guard等构造函数相关符号会被多次定义。 -
运行时支持缺失:SanitizerCoverage需要特定的运行时支持,直接链接bitcode时这些支持没有被正确包含。
解决方案
正确的做法是避免让afl-clang-fast进行二次插桩。可以采用以下任一方法:
- 使用普通clang链接:
clang -o test_elf test.bc /path/to/afl-compiler-rt.o
- 分步编译:
# 生成目标文件
afl-clang-fast -c -o test.o test.c
# 直接链接
afl-clang-fast -o test_elf test.o
技术细节
AFL++的插桩过程实际上分为几个关键步骤:
- 前端插桩:通过LLVM pass在IR层面插入覆盖率跟踪代码
- 运行时支持:链接afl-compiler-rt.o提供必要的运行时函数
- 构造函数注册:通过module构造函数确保插桩代码在程序启动时初始化
当重复插桩时,这些机制会互相干扰,特别是构造函数相关的符号会冲突。这也是为什么在LLVM 17中会直接触发断言失败,而在较早版本中表现为链接错误。
最佳实践建议
- 对于需要处理bitcode的工作流,建议明确区分插桩阶段和链接阶段
- 如果需要多次处理bitcode,考虑使用LLVM的opt工具手动控制pass的应用
- 保持AFL++版本更新,新版通常会修复这类兼容性问题
- 对于复杂项目,考虑使用AFL++的LTO(链接时优化)模式,它可以更好地处理整个程序的插桩
理解这些底层机制有助于开发者更有效地使用AFL++进行模糊测试,特别是在需要自定义插桩或处理bitcode的场景下。
GLM-5智谱 AI 正式发布 GLM-5,旨在应对复杂系统工程和长时域智能体任务。Jinja00
GLM-5-w4a8GLM-5-w4a8基于混合专家架构,专为复杂系统工程与长周期智能体任务设计。支持单/多节点部署,适配Atlas 800T A3,采用w4a8量化技术,结合vLLM推理优化,高效平衡性能与精度,助力智能应用开发Jinja00
请把这个活动推给顶尖程序员😎本次活动专为懂行的顶尖程序员量身打造,聚焦AtomGit首发开源模型的实际应用与深度测评,拒绝大众化浅层体验,邀请具备扎实技术功底、开源经验或模型测评能力的顶尖开发者,深度参与模型体验、性能测评,通过发布技术帖子、提交测评报告、上传实践项目成果等形式,挖掘模型核心价值,共建AtomGit开源模型生态,彰显顶尖程序员的技术洞察力与实践能力。00
Kimi-K2.5Kimi K2.5 是一款开源的原生多模态智能体模型,它在 Kimi-K2-Base 的基础上,通过对约 15 万亿混合视觉和文本 tokens 进行持续预训练构建而成。该模型将视觉与语言理解、高级智能体能力、即时模式与思考模式,以及对话式与智能体范式无缝融合。Python00
MiniMax-M2.5MiniMax-M2.5开源模型,经数十万复杂环境强化训练,在代码生成、工具调用、办公自动化等经济价值任务中表现卓越。SWE-Bench Verified得分80.2%,Multi-SWE-Bench达51.3%,BrowseComp获76.3%。推理速度比M2.1快37%,与Claude Opus 4.6相当,每小时仅需0.3-1美元,成本仅为同类模型1/10-1/20,为智能应用开发提供高效经济选择。【此简介由AI生成】Python00
Qwen3.5Qwen3.5 昇腾 vLLM 部署教程。Qwen3.5 是 Qwen 系列最新的旗舰多模态模型,采用 MoE(混合专家)架构,在保持强大模型能力的同时显著降低了推理成本。00- RRing-2.5-1TRing-2.5-1T:全球首个基于混合线性注意力架构的开源万亿参数思考模型。Python00