John the Ripper构建系统中SIMD标志的传递优化

2025-05-21 17:51:32作者：郦嵘贵Just

John the Ripper jumbo - advanced offline password cracker, which supports hundreds of hash and cipher types, and runs on many operating systems, CPUs, GPUs, and even some FPGAs

项目地址：https://gitcode.com/gh_mirrors/jo/john

在John the Ripper密码分析工具的构建系统中，存在一个关于SIMD（单指令多数据流）指令集标志传递的优化问题。这个问题最初在项目内部讨论中被发现，涉及到如何将主构建的SIMD编译标志正确传递到子目录的库构建过程中。

问题背景

现代CPU支持的SIMD指令集（如SSE、AVX、AES-NI等）可以显著加速密码哈希计算。John the Ripper作为性能敏感的密码分析工具，充分利用这些指令集是其核心优化手段之一。然而在当前构建系统中，子目录（如mbedtls等第三方库）的编译过程并未继承主构建的SIMD相关编译标志。

这种分离的编译方式可能导致两个问题：

子模块无法利用与主程序相同的CPU特性，造成性能损失
在VEX编码指令和传统SSE代码之间可能出现性能下降的转换

技术分析

通过分析项目中的Makefile.in文件，我们可以看到当前的编译标志处理机制：

主Makefile.in中定义了多组编译标志：

CFLAGSX：基础编译标志集合
CFLAGS_MAIN：专用于john.c主文件的特殊标志
CFLAGS：通用编译标志

问题根源在于子目录的Makefile.in没有完整继承这些标志，特别是缺少@CC_CPU@和@CC_MAIN_CPU@等关键SIMD相关标志。

解决方案

项目维护者提出了两种解决思路：

全面重构方案：修改configure.ac，使@CFLAGS@包含所有必要标志，然后简化Makefile中的标志处理逻辑。
快速修复方案：在子目录的Makefile.in中标准化编译标志定义，确保包含所有必要的SIMD相关标志。

考虑到改动范围和影响，项目决定采用第二种方案，即在子目录Makefile.in中使用如下标准化定义：

CFLAGS = -c -DAC_BUILT @CC_CPU@ @CC_MAIN_CPU@ @CFLAGS@ @JOHN_NO_SIMD@ @CFLAGS_EXTRA@ @OPENSSL_CFLAGS@ @OPENMP_CFLAGS@ @HAVE_MPI@ @PTHREAD_CFLAGS@ @CPPFLAGS@

实施细节

对于特定的AES-NI指令集支持问题（#5593），解决方案是将-maes -mpclmul标志添加到@CC_CPU@中，这样就能自动传播到所有子目录的构建过程中。

性能考量

值得注意的是，这种改变可能会在某些CPU上引起性能回退，特别是从汇编代码切换到内部函数(intrinsics)的实现时。项目团队决定先解决功能完整性问题，性能优化将作为后续工作单独处理。这种分阶段处理的策略既保证了构建系统的正确性，又为后续针对性优化保留了空间。

总结

这次构建系统的优化确保了John the Ripper能够更一致地利用现代CPU的SIMD指令集，特别是在处理加密原语时。通过标准化子目录的编译标志处理，不仅解决了当前的问题，还为未来的构建系统改进奠定了基础。对于密码分析这种对性能极其敏感的应用，这类底层优化往往能带来显著的性能提升。

john

John the Ripper jumbo - advanced offline password cracker, which supports hundreds of hash and cipher types, and runs on many operating systems, CPUs, GPUs, and even some FPGAs

项目地址：https://gitcode.com/gh_mirrors/jo/john

登录后查看全文

项目优选

收起

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

433

392

MindSpeed-MM

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.67 K

986