JohnTheRipper处理RAR3加密文件时的校验碰撞问题分析

2025-05-21 19:55:38作者：农烁颖Land

john

项目地址：https://gitcode.com/gh_mirrors/john1/john

背景介绍

在密码恢复领域，RAR3格式的加密文件一直是一个具有挑战性的目标。近期，JohnTheRipper项目发现了一个关于RAR3加密文件处理的特殊案例，涉及到校验碰撞导致的假阳性问题。这个问题不仅影响了恢复效率，还可能导致用户误判恢复结果。

问题现象

用户报告了一个奇怪的现象：使用Hashcat工具能够"成功"恢复RAR3加密文件的密码，但实际解密后只能提取部分文件内容，且提取的文件内容明显是损坏的。而当使用JohnTheRipper尝试恢复相同的哈希值时，工具却无法找到密码。

经过深入分析，发现这是由于RAR3格式的特殊性导致的。RAR3加密文件实际上为每个文件条目生成独立的哈希值，而rar2john工具通常会选择体积最小的文件条目来提取哈希值（基于性能考虑，假设所有条目使用相同密码）。

技术原理

RAR3格式使用的加密机制存在一个关键特性：它实际上不是传统意义上的"哈希"，而是一种"非哈希"结构。这意味着：

所谓的"哈希值"实际上包含部分原始数据
验证机制依赖CRC32校验，而CRC32存在碰撞可能性
现代GPU每天可能产生1-2个CRC32碰撞的假阳性结果

当使用Hashcat这类工具时，由于仅依赖CRC32校验，可能会误报密码恢复成功。而JohnTheRipper使用了不同的unrar库实现，能够更准确地检测到解压失败的情况，因此不容易被CRC32碰撞所欺骗。

解决方案

JohnTheRipper团队通过以下改进解决了这个问题：

在unrar代码中添加了早期拒绝测试
增加了长度检查机制，验证解压后的数据是否符合预期大小
优化了Huffman检查前的预处理逻辑

这些改进使得假阳性结果在实际应用中几乎不可能出现，特别是对于较大的数据块，因为这会增加unrar检测错误输入的几率。

用户建议

对于需要恢复RAR3加密文件的用户，建议：

优先使用JohnTheRipper的最新版本
验证任何"恢复成功"的结果是否真正能够完整解压文件
注意解压后文件的大小是否与预期一致
对于多文件RAR存档，可能需要尝试提取不同文件条目的哈希值

总结

这个案例展示了密码恢复工具在处理特定加密格式时可能遇到的独特挑战。CRC32校验碰撞问题不仅影响恢复效率，还可能导致误判。JohnTheRipper通过改进验证机制，有效解决了这一问题，为用户提供了更可靠的恢复结果。

对于安全研究人员和密码恢复爱好者来说，理解这些底层原理和工具特性，有助于更有效地开展相关工作，避免被假阳性结果误导。

john

项目地址：https://gitcode.com/gh_mirrors/john1/john

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

nop-entropy

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

349

200

pytorch

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理