Cariddi工具中请求延迟功能的深入解析

2025-07-10 13:20:54作者：殷蕙予

在网络安全评估工具Cariddi的使用过程中，用户报告了一个关于请求延迟功能(-d参数)未按预期工作的问题。经过技术分析，我们发现这实际上是一个对工具工作机制的误解，而非真正的功能缺陷。

多线程架构的影响

Cariddi作为一款高效的网络爬取工具，默认采用多线程架构设计，并发线程数默认为20。当用户设置延迟参数时，这个延迟是应用于每个独立线程的，而非整个程序的全局速率限制。这意味着虽然每个线程都会遵守设置的延迟时间，但由于多个线程并行工作，从整体观察到的请求速率仍然会较高。

单线程模式下的验证

通过将并发线程数设置为1(-c 1参数)，可以验证延迟功能确实正常工作。在这种模式下，工具会严格遵循用户指定的延迟时间发送请求。测试表明，在本地环境中这种配置下延迟功能表现符合预期。

实际应用场景中的考量

在某些防护严格的网络环境(如渗透测试实验室)中，即使用户设置了单线程模式和较大延迟，仍可能遇到访问限制。这通常是因为：

目标页面可能已经包含了所有待爬取的链接，工具无需进行深度发现
网络设备可能实施了基于会话或IP的复杂速率限制策略
目标服务器可能有额外的防护机制

技术实现原理

Cariddi底层使用了Colly爬虫框架，该框架本身不提供全局速率限制功能。延迟参数(-d)控制的是单个线程在两次请求之间的最小间隔时间，而非整个程序的请求速率上限。这种设计选择是为了在遵守礼貌爬取原则的同时，保持较高的整体爬取效率。

给使用者的建议

对于需要严格控制请求速率的场景，建议：

结合使用-c 1和-d参数实现单线程延迟模式
考虑使用专业级网络设备模拟更精确的速率控制
对于特别敏感的目标，可采用分阶段、手工验证的方式

理解工具的内部工作机制有助于更有效地利用其功能特性，避免在实际评估工作中产生误解。Cariddi的这种设计权衡了效率与礼貌爬取的需求，用户应根据具体场景灵活调整参数配置。

cariddi

Take a list of domains, crawl urls and scan for endpoints, secrets, api keys, file extensions, tokens and more

项目地址：https://gitcode.com/gh_mirrors/ca/cariddi

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

pytorch

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

TorchAir 支持用户基于PyTorch框架和torch_npu插件在昇腾NPU上使用图模式进行推理。

本仓将收集和展示高质量的仓颉示例代码，欢迎大家投稿，让全世界看到您的妙趣设计，也让更多人通过您的编码理解和喜爱仓颉语言。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java