Unblob项目中DMG文件处理导致的偏移量错误问题分析

2025-07-02 14:46:25作者：姚月梅Lane

问题背景

在Unblob项目中，处理某些特定固件文件时出现了一个关于文件块偏移量的错误。具体表现为系统报告"Chunk has higher start_offset than end_offset"错误，其中end_offset值为0。这个问题在至少58个DLINK固件镜像中被发现，导致文件提取失败。

当用户尝试使用Unblob处理DCS-5009L_REVA_FIRMWARE_1.00.B1.zip固件时，系统抛出异常，显示一个文件块的起始偏移量(0xac5f2)大于结束偏移量(0x0)。正常情况下，结束偏移量应该大于起始偏移量，这表明存在某种逻辑错误。

经过深入分析，发现问题的根源在于固件中包含了一个名为h264plugin.dmg的DMG文件。DMG是苹果公司开发的磁盘映像格式，在路由器固件中出现这种情况较为罕见。

问题的技术本质在于两个处理器(bzip2和dmg)同时识别了UDBZ格式DMG文件中的重叠内容。UDBZ是DMG格式的一种变体，使用bzip2压缩算法。当两个处理器同时尝试处理同一段数据时，导致了偏移量计算的混乱。

开发团队提出了两种可能的解决方案：

增强bzip2处理器的识别能力：修改bzip2处理器，使其能够检测压缩流后是否跟随XML plist(这是DMG文件的特征标识)。这种方法能够从根本上避免错误的识别。
调整文件块包含逻辑：修改Chunk类的contains方法实现，将严格的小于比较改为小于等于比较。这种修改虽然简单，但可能影响其他场景下的处理逻辑。

最终，团队选择了更稳健的第一种方案，通过增强处理器的识别能力来避免错误的文件块识别。这种方法不仅解决了当前问题，还提高了工具对不同文件格式的识别准确性。