首页
/ 开源项目使用教程:Dark Patterns at Scale

开源项目使用教程:Dark Patterns at Scale

2025-04-20 17:54:10作者:丁柯新Fawn

1. 项目目录结构及介绍

dark-patterns 项目是一个开源的数据和代码集合,用于研究论文 "Dark Patterns at Scale: Findings from a Crawl of 11K Shopping Websites"。项目目录结构如下:

  • src/: 包含生成购物网站列表的代码、产品页面分类器以及结账爬虫(基于 OpenWPM,位于 crawler/ 目录中)。
  • data/: 包含购物网站列表、产品页面、聚类分析输出和最终暗模式列表。
  • analysis/: 包含进行聚类分析、某些类型暗模式的长期欺骗性分析、第三方流行度分析以及暗模式统计的代码。

2. 项目的启动文件介绍

项目的启动文件主要是位于 src/ 目录下的脚本,这些脚本用于执行项目的主要功能,例如:

  • generate_shopping_websites_list.py: 用于生成购物网站列表的脚本。
  • product_page_classifier.py: 用于分类产品页面的脚本。
  • checkout_crawler.py: 用于执行结账爬虫的脚本。

用户需要根据具体的操作指南,运行相应的脚本以启动相关的功能。

3. 项目的配置文件介绍

项目的配置文件主要用于设置项目运行时的参数和环境,常见的配置文件包括:

  • config.json: 包含项目全局配置的 JSON 文件,可能包含数据库连接信息、API 密钥、爬虫设置等。
  • requirements.txt: 包含项目运行所需 Python 库的列表。用户在开始项目之前需要确保所有依赖都已正确安装。

用户应根据项目的具体需求,适当修改配置文件中的参数,以确保项目能够正确运行。在修改配置文件之前,建议仔细阅读相关文档或注释,以理解每个配置项的作用和可能的值。

登录后查看全文
热门项目推荐