深入理解angr符号执行中的路径探索机制

2025-05-28 06:03:05作者：劳婵绚Shirley

背景介绍

angr是一个强大的二进制分析框架，它结合了静态分析和动态符号执行技术，能够自动探索程序执行路径并求解输入条件。在本文中，我们将通过一个具体案例来探讨angr在路径探索过程中的工作机制。

问题现象

用户在使用angr分析一个简单的C程序时发现，当尝试从函数f(x,y)开始探索到达target()的路径时，angr只找到了其中一条路径（y=1且x≠0），而没有发现另一条可能的路径（x=0且y=0）。

技术分析

程序结构分析

示例程序包含以下几个关键部分：

一个空函数target()作为目标点
辅助函数hw(x)根据输入返回0或1
函数f(x,y)在hw(x)==y时调用target()
主函数不做任何操作

从逻辑上看，存在两条路径可以到达target()：

当x=0且y=0时
当x≠0且y=1时

angr探索机制

angr的explore()方法默认行为是找到第一条可行路径后就会停止搜索。这是出于效率考虑的设计选择，因为在实际分析中，程序可能包含大量路径，完全探索所有路径会导致组合爆炸问题。

解决方案

要找到所有可能的路径，可以通过以下两种方式：

设置num_find参数为期望找到的路径数量：

simgr.explore(find=target_addr.rebased_addr, num_find=2)

使用更灵活的路径探索策略，例如：

while len(simgr.found) < 2 and len(simgr.active) > 0:
    simgr.step()

深入理解

符号执行原理

angr使用符号执行技术，将程序输入表示为符号变量而非具体值。在执行过程中，它会记录路径约束条件，最后使用约束求解器求解满足条件的输入值。

路径选择策略

angr提供了多种路径选择策略：

深度优先(DFS)
广度优先(BFS)
随机选择
基于覆盖率指导

默认情况下，angr会使用一种混合策略来平衡探索深度和广度。

实践建议

对于简单程序，可以适当增加num_find值来获取更多路径
对于复杂程序，应考虑使用更智能的探索策略或设置超时限制
可以通过添加自定义的路径过滤条件来优化搜索过程
注意符号执行可能遇到路径爆炸问题，需要合理设置约束

总结

通过这个案例，我们了解到angr的路径探索机制默认只寻找第一条可行路径。在实际使用中，开发者需要根据分析目标明确设置探索参数，才能获取完整的路径覆盖。理解这一机制对于有效使用符号执行技术进行程序分析至关重要。

angr

A powerful and user-friendly binary analysis platform!

项目地址：https://gitcode.com/gh_mirrors/an/angr

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。