unblob项目中ExtFS解析器数值异常问题分析

2025-07-02 11:43:42作者：田桥桑Industrious

问题背景

在文件解析工具unblob中，存在一个针对ExtFS(Ext文件系统)解析器的数值异常问题。该问题由模糊测试发现，当处理特殊构造的ExtFS文件系统镜像时，会导致内存耗尽现象。

技术细节

问题成因

问题的核心出现在ExtFS解析器计算块偏移量的过程中。具体来说，当解析ExtFS超级块时，程序会使用s_log_block_size字段来计算实际块大小：

block_size = 1024 << s_log_block_size

在正常情况下，s_log_block_size应该是一个较小的值(通常为0-5)。然而，当该字段被设置为一个极大值(如0xff000000)时，会导致计算结果超出合理范围：

offset = 0x400 << 0xff000000  # 这将产生一个异常大的数值

问题表现

当处理特殊构造的ExtFS镜像时，会出现以下现象：

计算得到的end_offset值异常巨大，甚至无法转换为字符串表示
尝试打印或处理该偏移量时，会触发内存耗尽
最终导致进程因超出内存限制(2560MB)而被终止

影响分析

该问题属于资源耗尽类型问题，用户可以通过构造特殊的ExtFS镜像，导致unblob工具在处理时消耗大量系统资源，最终异常终止。

解决方案

修复方法

正确的修复方式是在解析ExtFS头部时，对s_log_block_size字段进行有效性验证：

def valid_header(header):
    if header.s_log_block_size > MAX_REASONABLE_BLOCK_SIZE:
        return False
    # 其他验证...
    return True

其中MAX_REASONABLE_BLOCK_SIZE应设置为一个合理的上限值(如10)，因为在实际的Ext文件系统中，块大小不会过大。

防御性编程建议

在处理文件系统元数据时，应遵循以下原则：

对所有从文件读取的数值进行范围检查
对可能引起指数增长的计算进行限制
对计算结果进行合理性验证
使用安全的数值运算函数，防止数值异常

总结

文件解析工具在处理外部输入时，必须对所有的元数据字段进行严格的验证。unblob项目中ExtFS解析器的这个问题提醒我们，即使是看似普通的数值字段，如果缺乏适当的验证，也可能导致严重的系统问题。通过添加合理的范围检查，可以有效地预防此类问题的发生。

unblob

Extract files from any kind of container formats

项目地址：https://gitcode.com/gh_mirrors/un/unblob

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

leetcode

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.37 K

781