angr项目中的函数输入分析问题解析
2025-05-28 10:47:51作者:幸俭卉
问题背景
在逆向工程和二进制分析领域,angr是一个强大的符号执行框架,能够帮助研究人员分析二进制程序的行为。本文讨论了一个在使用angr分析函数输入时遇到的特殊情况:当尝试找出所有使函数返回真值的输入时,系统遗漏了部分有效输入。
问题函数分析
我们有一个简单的x86汇编函数,其逻辑结构如下:
- 比较输入参数与0xbaadf00d,如果相等则返回1
- 否则比较参数与0xcafeface,如果相等则返回1
- 最后比较参数与0xdeadbeef,如果相等则返回1,否则返回0
从逻辑上看,这个函数应该在输入为0xbaadf00d、0xcafeface或0xdeadbeef时返回真值。
使用angr分析的问题
当使用angr的callable功能直接分析这个函数时,出现了以下异常情况:
- 生成的抽象语法树(AST)结构异常复杂,包含了一些看似冗余的条件判断
- 最终只识别出了0xbaadf00d和0xcafeface两个有效输入,遗漏了0xdeadbeef
- 断言检查失败,验证了结果的不完整性
问题根源
经过深入分析,发现问题出在angr的callable功能实现上。callable在处理函数调用时,没有完全正确地跟踪所有执行路径,导致部分分支条件被错误地合并或忽略。具体表现为:
- 条件分支的路径探索不完整
- 生成的AST包含冗余条件,如
(arg_0_32 == 0xcafeface || !(arg_0_32 == 0xbaadf00d) && !(arg_0_32 == 0xcafeface))
这样的表达式明显可以简化 - 最终约束条件过于严格,排除了有效的解
解决方案
通过改用更底层的符号执行方法,我们成功解决了这个问题。具体改进包括:
- 使用
project.factory.call_state
创建初始状态 - 通过
simgr.explore
显式探索执行路径 - 手动收集和验证各个路径上的约束条件
- 使用求解器枚举所有满足条件的输入
这种方法虽然代码量稍多,但能够更精确地控制符号执行过程,确保所有执行路径都被正确探索。
技术要点
-
符号执行与约束求解:angr的核心能力在于将程序执行转化为符号表达式,并通过约束求解器找到满足特定条件的输入。
-
路径探索策略:不同的分析方法会影响路径覆盖的完整性。直接使用callable可能隐藏了一些底层细节,而显式的路径探索则更加可控。
-
约束优化:复杂的约束条件可能导致求解效率下降或结果不完整。在实际应用中,适当的约束简化常常能提高分析的准确性。
最佳实践建议
- 对于简单函数,可以直接使用callable进行快速分析
- 当遇到复杂逻辑或结果不符合预期时,应改用更底层的符号执行方法
- 始终验证分析结果,确保没有遗漏重要路径
- 注意约束条件的简化,避免引入不必要的复杂性
通过这个案例,我们不仅解决了具体的技术问题,更重要的是理解了angr不同分析方法的适用场景和局限性,这对后续的二进制分析工作具有重要的指导意义。
登录后查看全文
热门项目推荐
- DDeepSeek-V3.1-BaseDeepSeek-V3.1 是一款支持思考模式与非思考模式的混合模型Python00
- QQwen-Image-Edit基于200亿参数Qwen-Image构建,Qwen-Image-Edit实现精准文本渲染与图像编辑,融合语义与外观控制能力Jinja00
GitCode-文心大模型-智源研究院AI应用开发大赛
GitCode&文心大模型&智源研究院强强联合,发起的AI应用开发大赛;总奖池8W,单人最高可得价值3W奖励。快来参加吧~042CommonUtilLibrary
快速开发工具类收集,史上最全的开发工具类,欢迎Follow、Fork、StarJava04GitCode百大开源项目
GitCode百大计划旨在表彰GitCode平台上积极推动项目社区化,拥有广泛影响力的G-Star项目,入选项目不仅代表了GitCode开源生态的蓬勃发展,也反映了当下开源行业的发展趋势。06GOT-OCR-2.0-hf
阶跃星辰StepFun推出的GOT-OCR-2.0-hf是一款强大的多语言OCR开源模型,支持从普通文档到复杂场景的文字识别。它能精准处理表格、图表、数学公式、几何图形甚至乐谱等特殊内容,输出结果可通过第三方工具渲染成多种格式。模型支持1024×1024高分辨率输入,具备多页批量处理、动态分块识别和交互式区域选择等创新功能,用户可通过坐标或颜色指定识别区域。基于Apache 2.0协议开源,提供Hugging Face演示和完整代码,适用于学术研究到工业应用的广泛场景,为OCR领域带来突破性解决方案。00openHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!C0299- WWan2.2-S2V-14B【Wan2.2 全新发布|更强画质,更快生成】新一代视频生成模型 Wan2.2,创新采用MoE架构,实现电影级美学与复杂运动控制,支持720P高清文本/图像生成视频,消费级显卡即可流畅运行,性能达业界领先水平Python00
- GGLM-4.5-AirGLM-4.5 系列模型是专为智能体设计的基础模型。GLM-4.5拥有 3550 亿总参数量,其中 320 亿活跃参数;GLM-4.5-Air采用更紧凑的设计,拥有 1060 亿总参数量,其中 120 亿活跃参数。GLM-4.5模型统一了推理、编码和智能体能力,以满足智能体应用的复杂需求Jinja00
Yi-Coder
Yi Coder 编程模型,小而强大的编程助手HTML013
热门内容推荐
最新内容推荐
项目优选
收起

React Native鸿蒙化仓库
C++
176
260

🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
854
505

openGauss kernel ~ openGauss is an open source relational database management system
C++
129
182

旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
254
295

🔥🔥🔥ShopXO企业级免费开源商城系统,可视化DIY拖拽装修、包含PC、H5、多端小程序(微信+支付宝+百度+头条&抖音+QQ+快手)、APP、多仓库、多商户、多门店、IM客服、进销存,遵循MIT开源协议发布、基于ThinkPHP8框架研发
JavaScript
93
15

本仓将收集和展示高质量的仓颉示例代码,欢迎大家投稿,让全世界看到您的妙趣设计,也让更多人通过您的编码理解和喜爱仓颉语言。
Cangjie
331
1.08 K

本仓将收集和展示仓颉鸿蒙应用示例代码,欢迎大家投稿,在仓颉鸿蒙社区展现你的妙趣设计!
Cangjie
397
370

一款跨平台的 Markdown AI 笔记软件,致力于使用 AI 建立记录和写作的桥梁。
TSX
83
4

为仓颉编程语言开发者打造活跃、开放、高质量的社区环境
Markdown
1.07 K
0

deepin linux kernel
C
21
5