John the Ripper项目中Argon2内存分配优化的回归与修复

2025-05-21 21:03:27作者：彭桢灵Jeremy

John the Ripper jumbo - advanced offline password cracker, which supports hundreds of hash and cipher types, and runs on many operating systems, CPUs, GPUs, and even some FPGAs

项目地址：https://gitcode.com/gh_mirrors/jo/john

在密码分析工具John the Ripper的开发过程中，Argon2哈希算法的内存管理优化曾经历了一次重要的回归和修复过程。本文将深入分析这一技术问题的背景、影响及解决方案。

问题背景

Argon2作为现代密码哈希算法，其设计特点之一就是内存密集型计算。在John the Ripper的实现中，原本采用了一项重要优化：保留并重用Argon2的内存分配，只有在需要增加内存大小时才重新分配。这种优化可以显著减少频繁内存分配释放带来的性能开销。

然而在某个版本更新中，这一优化被意外移除，导致每次计算哈希时都会进行完整的内存分配和释放操作，这无疑会对性能产生负面影响。

技术分析

原始优化的核心思想是：

在首次计算时分配足够大的内存区域
后续计算中重用该内存区域
仅在需要更大内存时才重新分配
在程序结束时统一释放

这种设计避免了重复的内存管理操作，特别适合John the Ripper这类需要大量计算哈希的场景。

回归后的实现变为每次计算都进行完整的内存分配和释放循环，这在性能敏感的应用中是不可取的。

解决方案

开发团队提出了两种可能的修复路径：

直接恢复原有优化：这是较为直接的解决方案，可以快速恢复性能表现。
使用上游代码的内存分配回调机制：这是更优雅的长期解决方案，通过：
- 在释放回调中保存指针和大小标记而非实际释放
- 在分配回调中检查是否有可重用的内存区域
- 必要时才进行实际分配或调整大小
- 利用现有的alloc_region()机制简化检查并支持大页内存

实现考量

在实现过程中，开发团队还注意到几个技术细节：

线程安全需要特别关注，内存区域需要按线程划分
原有实现中使用了omp_autotune()和模运算的内存索引机制需要仔细评估
OpenCL实现中可以采用固定大块内存分配策略

总结

内存管理优化在密码分析这类计算密集型应用中至关重要。John the Ripper团队对Argon2实现的这一优化回归问题的处理，展示了专业软件开发中对性能细节的关注和系统性的解决方案设计。最终的修复既考虑了短期可实施性，也兼顾了长期代码维护的便利性。

这一案例也提醒我们，在引入上游代码更新时，需要特别关注原有优化是否被保留，必要时应该通过适当的抽象层来保持核心优化不受影响。

John the Ripper jumbo - advanced offline password cracker, which supports hundreds of hash and cipher types, and runs on many operating systems, CPUs, GPUs, and even some FPGAs

项目地址：https://gitcode.com/gh_mirrors/jo/john

登录后查看全文

项目优选

收起

deepin linux kernel

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

flutter_flutter

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

cangjie_compiler

仓颉编译器源码及 cjdb 调试工具。

ohos_react_native

React Native鸿蒙化仓库

cangjie_runtime

仓颉编程语言运行时与标准库。