EMBA项目中P99模块的MD5校验竞争条件问题分析

2025-06-27 05:39:56作者：邓越浪Henry

问题背景

在EMBA嵌入式固件分析工具中，P99模块负责预处理和分析固件中的二进制文件。该模块使用helpers_emba_prepare.sh脚本中的binary_architecture_threader函数来处理每个二进制文件，计算其MD5校验值并记录相关信息。

问题现象

在处理包含重复文件（不同文件名但相同内容）的固件时，发现P99模块生成的p99_prepare_analyzer.csv日志文件中存在MD5校验值重复记录的情况。这会导致后续模块（如S09）在处理这些文件时出现异常，因为某些功能假设MD5校验值是唯一的。

技术分析

竞争条件根源

问题出在binary_architecture_threader函数的MD5校验值检查逻辑中：

函数首先检查当前文件的MD5值是否已存在于临时文件p99_md5sum_done.tmp中
如果不存在，则将MD5值追加到该文件并继续处理
当多个线程同时处理相同内容的文件时，可能出现以下时序：
- 线程A检查MD5值，发现不存在
- 线程B检查相同的MD5值，同样发现不存在
- 两个线程都继续处理并将相同的MD5值写入临时文件
- 导致最终日志文件中出现重复记录

影响范围

这种竞争条件主要影响以下场景：

固件中包含多个相同内容但不同名称的文件
这些文件位于相同或相近目录中
在多核系统上运行时，并发处理的可能性增加

解决方案

临时解决方案

在S09等后续模块中，可以通过在grep命令后添加head -1来确保只获取第一个匹配的文件路径：

lMACHTED_FNAME=$(grep ";${lMD5_SUM_MATCHED};" "${P99_CSV_LOG}" | cut -d ';' -f1 | head -1 || true)

根本解决方案

更彻底的修复是在P99模块中防止竞争条件的发生：

使用原子操作确保MD5校验值的检查和写入是互斥的
可以通过文件锁定机制或使用更安全的临时文件处理方式
在写入前再次确认MD5值是否已存在，实现双重检查

最佳实践建议

对于处理关键资源的并发操作，应该始终考虑竞争条件的可能性
在多线程环境中，对共享资源的访问应该进行适当的同步
日志文件等输出结果应该保持一致性，避免重复记录
在设计模块间的数据传递时，应该明确约定数据的唯一性要求

总结

EMBA工具中的这个竞争条件问题展示了在多线程环境下处理共享资源时常见的陷阱。通过分析这个问题，我们不仅解决了具体的MD5校验值重复问题，也为类似工具的开发提供了有价值的经验教训。在嵌入式固件分析这类资源密集型任务中，正确处理并发问题对于保证分析结果的准确性和可靠性至关重要。

emba

EMBA - The firmware security analyzer

项目地址：https://gitcode.com/gh_mirrors/em/emba

登录后查看全文

项目优选

收起

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。

AscendNPU-IR是基于MLIR（Multi-Level Intermediate Representation）构建的，面向昇腾亲和算子编译时使用的中间表示，提供昇腾完备表达能力，通过编译优化提升昇腾AI处理器计算效率，支持通过生态框架使能昇腾AI处理器与深度调优

C++

415

298

EMBA项目中P99模块的MD5校验竞争条件问题分析

问题背景

问题现象

技术分析

竞争条件根源

影响范围

解决方案

临时解决方案

根本解决方案

最佳实践建议

总结

热门内容推荐

最新内容推荐

项目优选

EMBA项目中P99模块的MD5校验竞争条件问题分析

问题背景

问题现象

技术分析

竞争条件根源

影响范围

解决方案

临时解决方案

根本解决方案

最佳实践建议

总结

相关内容推荐

热门内容推荐

最新内容推荐

项目优选