SoFixer：内存dump So文件修复的创新解决方案

2026-04-23 09:56:25作者：裴锟轩Denise

项目地址：https://gitcode.com/gh_mirrors/so/SoFixer

内存dump技术在Android逆向工程中常用于获取运行时的共享库（So文件），但直接dump的文件往往因缺少完整的ELF结构信息而无法被常规工具分析。这些损坏的So文件通常表现为段表信息丢失、地址偏移错误或动态链接数据不完整。SoFixer作为专业的修复工具，通过重建ELF关键结构、修正内存地址映射和恢复动态链接信息，有效解决了这一技术难题，使逆向工程师能够对内存dump的So文件进行后续的静态分析和动态调试。

ELF文件损坏的技术挑战与修复思路

内存dump So文件的典型问题

从内存中直接dump的So文件会面临多重结构损坏问题，主要包括：

段头表(Shdr)缺失：内存映射过程中操作系统不会加载完整的段头信息
地址空间错位：dump文件的虚拟地址与磁盘文件的偏移地址不匹配
动态链接信息损坏：重定位表和符号表在内存中被动态修改
数据完整性问题：部分段（如.bss）在内存中未初始化或被覆盖

SoFixer的核心解决思路

SoFixer采用分层修复策略，通过"解析-验证-重建"三步法恢复ELF文件结构：

解析阶段：识别有效的程序头表(Phdr)和段数据
验证阶段：交叉校验段完整性和地址一致性
重建阶段：恢复缺失的段头表、修正地址偏移并重建动态链接信息

核心架构与工作原理

模块化架构设计

SoFixer采用清晰的分层架构，主要包含三大核心模块：

graph TD
    A[命令行接口层] --> B[核心修复引擎]
    C[ELF解析器] --> B
    D[文件I/O模块] --> C
    B --> E[输出模块]
    F[调试日志系统] --> A
    F --> B
    F --> C

ELF解析器：负责加载和解析损坏的ELF文件，提取可用的程序头和段信息
核心修复引擎：执行实际的ELF结构重建和地址修正工作
命令行接口层：处理用户输入参数，协调各模块工作流程

关键技术流程解析

ELF文件加载与解析流程

ElfReader类实现了ELF文件的加载与解析，核心流程如下：

bool ElfReader::Load() {
    if (!ReadElfHeader()) return false;  // 读取并验证ELF头部
    if (!VerifyElfHeader()) return false; // 验证ELF标识和版本
    if (!ReadProgramHeader()) return false; // 读取程序头表
    if (!ReserveAddressSpace()) return false; // 预留地址空间
    if (!LoadSegments()) return false; // 加载程序段
    return true;
}

该流程首先验证ELF文件的有效性，然后读取程序头表并加载各个段到内存，为后续修复工作奠定基础。

ELF重建工作流

ElfRebuilder类负责执行具体的修复工作，其核心流程包括：

程序头表修复：重建损坏的程序头信息
段头表重建：根据程序头和段数据恢复段头表
重定位修复：修正动态链接所需的重定位表
符号信息恢复：重建符号表和字符串表

sequenceDiagram
    participant ElfReader
    participant ElfRebuilder
    participant SoInfo
    participant Output

    ElfReader->>ElfRebuilder: 提供加载的ELF数据
    ElfRebuilder->>SoInfo: 读取动态链接信息
    SoInfo-->>ElfRebuilder: 返回符号和重定位数据
    ElfRebuilder->>ElfRebuilder: 重建程序头表
    ElfRebuilder->>ElfRebuilder: 重建段头表
    ElfRebuilder->>ElfRebuilder: 修复重定位表
    ElfRebuilder->>Output: 生成修复后的ELF文件

实战应用指南

环境搭建与编译

编译32位版本

git clone https://gitcode.com/gh_mirrors/so/SoFixer
cd SoFixer
mkdir build
cd build
cmake ..
make

编译64位版本

git clone https://gitcode.com/gh_mirrors/so/SoFixer
cd SoFixer
mkdir build
cd build
cmake -DSO_64=ON ..
make

基础修复操作

基本修复命令

sofixer -s dumped.so -o fixed.so

带内存基地址的修复

当已知So文件在内存中的加载地址时，使用-m参数提供基地址可获得更好的修复效果：

sofixer -s dumped.so -o fixed.so -m 0x7DB078B000

启用调试信息

添加-d参数可输出详细的修复过程日志，便于问题诊断：

sofixer -s dumped.so -o fixed.so -m 0x7DB078B000 -d

使用基准So文件辅助修复

对于严重损坏的文件，可以提供原始未加壳的So文件作为基准：

sofixer -s dumped.so -o fixed.so -b original.so

参数说明与使用建议

参数	全称	功能描述	使用建议
-s	--source	指定待修复的So文件路径	必须参数，确保文件路径正确
-o	--output	指定修复后的输出文件路径	建议使用不同于源文件的名称
-m	--memso	内存dump时的基地址（十六进制）	尽可能提供，可大幅提高修复成功率
-d	--debug	启用调试信息输出	修复失败时建议启用，用于问题诊断
-b	--baseso	基准So文件路径	当修复效果不佳时尝试使用
-h	--help	显示帮助信息	忘记参数用法时使用

核心技术深度解析

ELF头部修复机制

ElfReader类通过ReadElfHeader和VerifyElfHeader方法验证并修复ELF头部：

bool ElfReader::VerifyElfHeader() {
    if (memcmp(header_.e_ident, ELFMAG, SELFMAG) != 0) {
        FLOGE("Not an ELF file");
        return false;
    }
    // 验证ELF类别、数据编码和版本
    if (header_.e_ident[EI_CLASS] != ELFCLASS32 && header_.e_ident[EI_CLASS] != ELFCLASS64) {
        FLOGE("Unsupported ELF class");
        return false;
    }
    // 其他验证逻辑...
    return true;
}

该验证过程确保ELF文件的基本结构正确，为后续修复奠定基础。

动态重定位修复：从原理到实现

重定位修复是SoFixer的核心功能之一，ElfRebuilder通过relocate模板方法处理不同类型的重定位：

template <bool isRela>
void ElfRebuilder::relocate(uint8_t * base, Elf_Rel* rel, Elf_Addr dump_base) {
    // 重定位处理逻辑
    Elf_Addr* target = reinterpret_cast<Elf_Addr*>(base + rel->r_offset);
    Elf_Word sym = ELF_R_SYM(rel->r_info);
    Elf_Word type = ELF_R_TYPE(rel->r_info);
    
    // 根据不同的重定位类型执行相应的修正
    switch(type) {
        case R_ARM_ABS32:
            *target = si.symtab[sym].st_value - dump_base;
            break;
        case R_ARM_REL32:
            *target = (*target - dump_base) + si.load_bias;
            break;
        // 其他重定位类型处理...
    }
}

这段代码展示了如何根据ARM架构的重定位类型，修正内存地址以适应文件偏移。

符号表重建策略

SoFixer通过ReadSoInfo方法从动态段中提取并重建符号信息：

bool ElfRebuilder::ReadSoInfo() {
    // 获取动态段信息
    elf_reader_->GetDynamicSection(&si.dynamic, &si.dynamic_count, &si.dynamic_flags);
    
    // 解析动态标签，提取符号表、字符串表和哈希表信息
    for (size_t i = 0; i < si.dynamic_count; ++i) {
        switch (si.dynamic[i].d_tag) {
            case DT_SYMTAB:
                si.symtab = reinterpret_cast<Elf_Sym*>(elf_reader_->load_bias() + si.dynamic[i].d_un.d_ptr);
                break;
            case DT_STRTAB:
                si.strtab = reinterpret_cast<const char*>(elf_reader_->load_bias() + si.dynamic[i].d_un.d_ptr);
                break;
            case DT_STRSZ:
                si.strtabsize = si.dynamic[i].d_un.d_val;
                break;
            // 其他动态标签处理...
        }
    }
    return true;
}

通过解析ELF动态段中的标签信息，SoFixer能够重建符号表和字符串表，恢复函数和变量的名称信息。

高级应用与最佳实践

修复效果验证方法

修复完成后，可使用以下工具验证So文件的有效性：

readelf：检查ELF结构完整性

readelf -h fixed.so  # 检查ELF头部
readelf -l fixed.so  # 检查程序头表
readelf -S fixed.so  # 检查段头表

objdump：验证反汇编功能

objdump -d fixed.so | less  # 查看反汇编代码

IDA Pro/Ghidra：尝试加载修复后的文件进行分析

复杂场景处理策略

针对严重损坏文件的修复策略

当面对严重损坏的So文件时，建议采取以下步骤：

首先尝试基础修复：sofixer -s dumped.so -o fixed_v1.so
若失败，添加内存基地址：sofixer -s dumped.so -o fixed_v2.so -m 0x7DB078B000
若仍失败，使用基准So文件：sofixer -s dumped.so -o fixed_v3.so -m 0x7DB078B000 -b original.so
启用调试模式分析问题：sofixer -s dumped.so -o fixed_v4.so -d