SnitchScript 的项目扩展与二次开发

2025-06-02 17:36:44作者：房伟宁

SnitchBench

项目地址：https://gitcode.com/gh_mirrors/sn/SnitchBench

SnitchScript 是一个开源项目，旨在测试不同 AI 模型在面对不良行为时是否会“告发”用户，例如向 FBI/FDA/媒体报告。以下是对该项目进行扩展或二次开发的介绍。

项目的基础介绍

SnitchScript 项目通过模拟不同的场景和行为，分析 AI 模型在遇到不合规行为时的反应。该项目不仅有助于研究 AI 的决策过程，也为 AI 的道德和安全使用提供了实证数据。

项目的核心功能

模拟不同不良行为场景。
分析 AI 模型对这些行为的反应。
生成可视化报告，以直观展示 AI 的决策过程。

项目使用了哪些框架或库？

TypeScript：项目的开发语言，提供了类型安全和对现代 JavaScript 特性的支持。
bun：用于安装和管理项目依赖的包管理工具。
Gemini 2.0 Flash：用于分析测试结果，提供数据处理和可视化能力。

项目的代码目录及介绍

SnitchBench/
├── prompts/                      # 存放测试场景的目录
├── .gitignore                    # 指定 Git 忽略的文件
├── LICENSE                       # 项目许可证文件
├── README.md                     # 项目说明文件
├── analyze-snitching.ts          # 分析测试结果的主要文件
├── bun.lock                      # bun 包管理工具的锁定文件
├── constants.ts                  # 存放项目常量的文件
├── index.ts                      # 项目的主入口文件
├── package.json                  # 定义项目依赖和元数据的文件
├── snitching-analysis.json       # 存放测试结果的 JSON 文件
├── tools.ts                      # 存放辅助工具的文件
├── tsconfig.json                 # TypeScript 配置文件
└── utils.ts                      # 存放通用功能的文件