angr项目中MemoryLocation原子类型Endianness未设置问题分析

2025-05-28 06:22:37作者：申梦珏Efrain

A powerful and user-friendly binary analysis platform!

项目地址：https://gitcode.com/gh_mirrors/an/angr

问题背景

在二进制分析框架angr的使用过程中，当开发者尝试通过CustomFunctionHandler进行ReachingDefinitions分析时，发现对MemoryLocation类型的原子对象执行deref操作时会出现异常行为。具体表现为内存地址被错误地解释，例如本应访问0x00fbac地址却错误地访问了0xacfb00地址。

问题本质

该问题的核心在于MemoryLocation原子类型的endianness（字节序）属性未被正确初始化。在angr的ReachingDefinitions分析过程中，当处理函数参数时，如果参数是SimStackArg类型，系统会创建相应的MemoryLocation原子对象，但这些对象没有正确设置endianness属性。

技术细节

1. 问题触发路径

当执行state.deref操作时，系统会经历以下关键步骤：

首先获取参数对应的原子对象（MemoryLocation类型）
调用get_values方法获取内存值
由于MemoryLocation的endianness未设置，默认使用大端序(BE)
导致后续内存地址解析错误

2. 关键代码分析

在angr/angr/knowledge_plugins/key_definitions/atoms.py文件中，from_argument方法负责将参数转换为原子对象。对于SimStackArg类型的参数，当前实现如下：

elif isinstance(argument, SimStackArg):
    if sp is None:
        raise ValueError("You必须提供栈指针来转换SimStackArg")
    return MemoryLocation(SpOffset(arch.bits, argument.stack_offset + sp), argument.size)

这里缺少了对endianness的设置，导致后续内存访问出现问题。

3. 解决方案

修改后的代码应显式设置endianness：

elif isinstance(argument, SimStackArg):
    if sp is None:
        raise ValueError("You必须提供栈指针来转换SimStackArg")
    return MemoryLocation(SpOffset(arch.bits, argument.stack_offset + sp), 
           argument.size, 
           endness=arch.memory_endness)

影响范围

这个问题不仅存在于参数转换过程中，在以下文件中也存在类似问题：

angr/analyses/reaching_definitions/engine_vex.py
angr/analyses/reaching_definitions/rd_initializer.py

这些文件中创建MemoryLocation对象时同样没有正确设置endianness属性。

技术影响

1. 内存访问错误

未设置正确的endianness会导致：

内存地址解析错误
数据读取顺序错误
分析结果不准确

2. 分析可靠性下降

在二进制分析中，内存访问是基础操作。错误的endianness设置会导致整个分析链的可靠性下降，特别是在处理以下场景时：

字符串操作分析
数据结构解析
跨平台二进制分析

最佳实践建议

在创建MemoryLocation对象时，总是显式设置endianness
对于架构相关的内存访问，使用arch.memory_endness作为默认值
在自定义函数处理器中，明确指定内存操作的字节序

总结

angr框架中的MemoryLocation原子类型endianness未设置问题，虽然表面上看是一个简单的属性缺失，但实际上会影响整个静态分析过程的准确性。开发者在扩展angr功能或进行自定义分析时，应当特别注意内存相关属性的完整设置，特别是字节序这种架构相关的关键属性。

这个问题也提醒我们，在开发二进制分析工具时，架构相关属性的传播和一致性维护是需要特别关注的设计点。正确的做法是在对象创建时就完整设置所有必要的架构相关属性，而不是依赖后续的默认值或补救措施。

A powerful and user-friendly binary analysis platform!

项目地址：https://gitcode.com/gh_mirrors/an/angr

登录后查看全文

项目优选

收起

deepin linux kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

昇腾LLM分布式训练框架

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。