UPX压缩DLL在MemoryModule加载时的熵获取问题分析

2025-05-14 18:34:24作者：宣海椒Queenly

UPX - the Ultimate Packer for eXecutables

项目地址：https://gitcode.com/gh_mirrors/up/upx

问题背景

UPX作为一款流行的可执行文件压缩工具，在压缩Windows DLL文件时存在一个值得注意的技术问题。当使用MemoryModule这类内存加载器加载UPX压缩后的DLL时，会出现__get_entropy函数缺失的问题，导致程序崩溃。

问题现象

通过实际测试发现，UPX压缩后的DLL文件在以下两种加载方式中表现不同：

使用传统的LoadLibraryA加载时工作正常
使用MemoryModule内存加载时会出现崩溃

崩溃点出现在程序尝试调用__get_entropy函数时，该函数地址无法正确解析，导致跳转到一个无效地址。特别值得注意的是，当系统中同时加载多个UPX压缩的DLL时，这个问题会更加明显。

技术分析

深入分析发现，UPX在压缩DLL时存在以下技术特点：

固定ImageBase问题：UPX默认使用0x10000000作为所有DLL的ImageBase，这会导致当多个UPX压缩的DLL同时加载时产生基址冲突。
重定位处理不足：UPX生成的代码中存在硬编码地址（如F789A000），而没有正确处理基址重定位。在MemoryModule加载环境下，这些硬编码地址无法正确映射到实际加载地址。
熵获取机制缺陷：UPX在初始化阶段依赖__get_entropy函数，但在MemoryModule环境下，该函数的导入表处理可能存在问题。

解决方案探讨

针对这个问题，可以考虑以下解决方案：

基址重定向：修改UPX压缩后的代码，使其能够正确处理基址重定位，将硬编码地址替换为基于实际加载地址的计算。
导入表修复：确保__get_entropy等关键函数的导入表项在内存加载环境下能够正确解析。
ImageBase随机化：修改UPX使其不再固定使用0x10000000作为ImageBase，而是支持随机基址或用户指定基址。

实际影响

这个问题主要影响以下场景：

使用内存加载技术的应用程序
需要同时加载多个UPX压缩DLL的系统
对安全性要求较高，依赖熵获取机制的程序

结论

UPX作为一款成熟的压缩工具，在标准加载环境下表现良好，但在特殊加载方式下仍存在改进空间。开发者在使用UPX压缩DLL时，特别是在内存加载场景下，应当注意这些问题并考虑相应的解决方案。对于UPX项目本身，这也提供了一个改进方向，可以增强其在各种加载环境下的兼容性。

UPX - the Ultimate Packer for eXecutables

项目地址：https://gitcode.com/gh_mirrors/up/upx

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

flutter_flutter

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理