深入理解Angr项目中状态不可变性对程序输出的影响

2025-05-28 04:52:32作者：咎竹峻Karen

概述

在使用符号执行工具Angr进行程序分析时，理解状态(State)的不可变性(Immutability)特性至关重要。本文将通过一个简单的"hello world"程序示例，详细解析Angr状态管理机制及其对程序输出获取的影响。

Angr状态不可变性原理

Angr中的状态对象(State)采用了不可变设计模式。这意味着一旦创建了一个状态对象，就不能直接修改它的属性。这种设计带来了几个重要优势：

保证了状态在符号执行过程中的一致性
便于回溯和状态比较
支持并行符号执行

当我们将初始状态传递给SimulationManager时，管理器内部会创建该状态的副本进行操作，而不是直接修改原始状态对象。

实际问题分析

在用户提供的示例中，程序非常简单：

#include <stdio.h>

int main(void) {
    puts("hello world");
}

用户尝试通过以下方式获取程序输出：

import angr

proj = angr.Project("a.out", auto_load_libs=False)
state = proj.factory.entry_state()
sim = proj.factory.simulation_manager(state)

# 错误方式：直接查询原始状态
print(state.posix.dumps(1))  # 输出b''

问题出现的原因是用户直接查询了原始状态对象，而这个状态从未被SimulationManager修改过。

正确解决方案

要获取程序执行后的输出，应该查询模拟执行完成后的终止状态(deadended state)：

# 运行模拟直到所有路径终止
sim.run()

# 正确方式：查询终止状态的输出
print(sim.deadended[0].posix.dumps(1))  # 输出b'hello world\n'

深入理解状态生命周期

初始状态创建：通过entry_state()创建，包含程序的初始条件
状态副本创建：SimulationManager开始执行时创建副本
状态演化：在符号执行过程中，管理器维护状态的各种副本
终止状态：当路径执行完成，状态进入deadended集合

最佳实践建议

始终通过SimulationManager的deadended、active等集合访问演化后的状态
如果需要保留初始状态，可以创建多个SimulationManager实例
对于复杂程序，注意检查多个终止状态可能的不同输出

总结

Angr的状态不可变性设计是其符号执行引擎的核心特性之一。理解这一特性对于正确获取程序输出、分析程序行为至关重要。通过查询SimulationManager维护的终止状态集合，而非原始状态对象，开发者可以准确获取程序执行后的各种输出信息。

angr

A powerful and user-friendly binary analysis platform!

项目地址：https://gitcode.com/gh_mirrors/an/angr

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

MindSpeed-MM

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。