JohnTheRipper项目中MSSQL05格式在AVX512BW构建下的哈希分析异常研究

2025-05-21 21:36:54作者：卓炯娓

问题背景

在密码安全审计工具JohnTheRipper的最新开发版本中，测试人员发现了一个与MSSQL05哈希格式相关的兼容性问题。该问题表现为：当使用支持AVX512BW指令集的处理器进行编译构建时，程序会遗漏部分特定密码的分析，而这些密码在使用AVX2指令集构建的版本中能够被正常处理。

测试人员通过对比测试发现，以下三个特定哈希值在AVX512BW构建中无法被处理：

值得注意的是，当这些哈希被单独测试时，AVX512BW构建又能够成功处理。这表明问题与并行处理机制相关，而非算法本身的实现错误。

经过深入调查，开发团队发现了几个关键点：

编译器相关性：该问题在使用Clang编译器时出现，而使用GCC编译时则表现正常。这表明问题可能与不同编译器对AVX512BW指令集的优化实现差异有关。
SIMD并行度设置：在x86-64.h头文件中，Clang编译器默认将SHA1算法的SIMD并行度(SIMD_PARA_SHA1)设置为2，这导致了问题的出现。将其改为1后，问题得到解决。
内存清理机制：在set_key函数实现中，存在一个关键的内存清理循环。在AVX512BW构建中，由于并行处理的方式，这个清理循环可能过早终止，导致部分内存区域未被正确初始化。
字节序处理：代码中存在多处直接操作内存位置的硬编码实现，缺乏统一的字节序处理机制，这在不同架构和指令集下可能导致不一致的行为。

开发团队提出了多层次的解决方案：

立即解决方案：
- 对于Clang编译器，将SIMD_PARA_SHA1的值从2降为1
- 修改内存清理循环的逻辑，确保所有相关内存区域都被正确初始化
长期改进方案：
- 统一使用标准的字节序处理宏（如GETPOSW32）
- 重构内存访问代码，消除硬编码的内存位置计算
- 增强测试覆盖，特别是针对边界情况（如空密码、单字符密码等）