John the Ripper批处理模式中重复密码检测功能的优化与问题解析

2025-05-21 18:21:31作者：段琳惟

John the Ripper jumbo - advanced offline password cracker, which supports hundreds of hash and cipher types, and runs on many operating systems, CPUs, GPUs, and even some FPGAs

项目地址：https://gitcode.com/gh_mirrors/jo/john

John the Ripper作为一款知名的密码安全评估工具，其批处理模式（batch mode）默认启用了重复密码检测功能（dupe suppression），但长期以来存在一个设计限制——用户无法通过命令行参数直接控制该功能。本文将深入分析这一技术问题的背景、解决方案以及相关规则堆叠（rules-stack）功能的异常行为。

批处理模式与重复密码检测

批处理模式是John the Ripper的一种自动化工作模式，它默认组合了多种安全评估策略，包括字典测试和规则变形。在这种模式下，重复密码检测功能默认启用，这有助于避免对相同候选密码的重复测试，提高评估效率。

然而，用户无法通过--dupe-suppression命令行选项来显式控制这一功能，只能通过编辑配置文件或覆盖配置文件名来实现调整。这种设计限制了用户对内存使用和功能开关的灵活控制。

技术实现与解决方案

核心问题源于选项标志的处理逻辑。在源代码中，批处理模式标志FLG_BATCH_SET未包含规则相关标志FLG_RULES_ALLOW，导致相关选项被系统拒绝。

解决方案是在options.h文件中修改标志定义：

#define FLG_BATCH_SET (FLG_BATCH_CHK | FLG_CRACKING_SET | FLG_RULES_ALLOW)

这一修改不仅允许了--dupe-suppression选项，还意外地开放了--rules和--rules-stack选项在批处理模式中的使用。虽然这增加了灵活性，但也带来了新的行为特性需要验证。

规则堆叠功能的异常行为

在测试过程中，开发团队发现规则堆叠功能在特定条件下表现出异常：

统计信息输出顺序问题：规则总数统计信息在堆叠规则初始化前输出，导致显示的总规则数不准确。这个问题实际上在规则堆叠功能合并之初就已存在。
性能差异：在批处理模式下使用--rules-stack时，性能会从初始的1Mp/s逐渐下降，而使用-w -ru -rules-stack组合时则能稳定在5-6Mp/s。

经过深入分析，第一个问题被确认为纯粹的显示问题，通过调整日志输出顺序即可解决。第二个问题则需要更复杂的修复，涉及对rules.c中四处rules_stacked_after判断逻辑的修改，增加对FLG_BATCH_CHK标志的检查。