SnitchScript 的项目扩展与二次开发
2025-06-02 17:36:44作者:房伟宁
SnitchScript 是一个开源项目,旨在测试不同 AI 模型在面对不良行为时是否会“告发”用户,例如向 FBI/FDA/媒体报告。以下是对该项目进行扩展或二次开发的介绍。
项目的基础介绍
SnitchScript 项目通过模拟不同的场景和行为,分析 AI 模型在遇到不合规行为时的反应。该项目不仅有助于研究 AI 的决策过程,也为 AI 的道德和安全使用提供了实证数据。
项目的核心功能
- 模拟不同不良行为场景。
- 分析 AI 模型对这些行为的反应。
- 生成可视化报告,以直观展示 AI 的决策过程。
项目使用了哪些框架或库?
- TypeScript:项目的开发语言,提供了类型安全和对现代 JavaScript 特性的支持。
- bun:用于安装和管理项目依赖的包管理工具。
- Gemini 2.0 Flash:用于分析测试结果,提供数据处理和可视化能力。
项目的代码目录及介绍
SnitchBench/
├── prompts/ # 存放测试场景的目录
├── .gitignore # 指定 Git 忽略的文件
├── LICENSE # 项目许可证文件
├── README.md # 项目说明文件
├── analyze-snitching.ts # 分析测试结果的主要文件
├── bun.lock # bun 包管理工具的锁定文件
├── constants.ts # 存放项目常量的文件
├── index.ts # 项目的主入口文件
├── package.json # 定义项目依赖和元数据的文件
├── snitching-analysis.json # 存放测试结果的 JSON 文件
├── tools.ts # 存放辅助工具的文件
├── tsconfig.json # TypeScript 配置文件
└── utils.ts # 存放通用功能的文件
对项目进行扩展或者二次开发的方向
- 增加测试场景:可以添加更多的不良行为场景,以更全面地评估 AI 模型的反应。
- 集成更多 AI 模型:目前项目可能只支持特定的 AI 模型,可以扩展以支持更多类型的模型。
- 优化可视化报告:改进现有的可视化工具,或者开发新的可视化组件,以更直观地展示分析结果。
- 扩展分析功能:增加更多维度的分析功能,如时间序列分析、模型性能比较等。
- 增加用户交互:开发一个用户界面,允许用户自定义测试参数和查看实时分析结果。
通过上述的扩展和二次开发,SnitchScript 项目将能够为 AI 的研究和开发提供更强大的工具。
登录后查看全文
热门项目推荐
相关项目推荐
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust0171
cann-learning-hubCANN 学习中心仓,支持在线互动运行、边学边练,提供教程、示例与优化方案,一站式助力昇腾开发者快速上手。Jupyter Notebook090
Step-3.7-FlashStep-3.7-Flash是一个拥有 1980 亿参数的稀疏混合专家(MoE)视觉语言模型,由 1960 亿参数的语言主干网络和 18 亿参数的视觉编码器组合而成,具备原生图像理解能力。Python00
BitCPM-CANN-8BBitCPM-CANN 是首个基于华为昇腾 NPU 原生构建的端到端 1.58 位(三值化)大语言模型训练系统。该系统将量化感知训练(QAT)集成到 Megatron-LM 框架中,并结合 MindSpeed 加速,覆盖了从自定义三值算子到基于昇腾 910B 的分布式并行训练的完整训练栈。Python00
MiniCPM5-1BMiniCPM5-1B,这是 MiniCPM5 系列的首款模型。它是一个专为端侧、本地部署和资源受限场景打造的 10 亿参数密集型 Transformer 模型,达到了 10 亿参数级开源模型的 SOTA 水平Jinja00
skillhubopenJiuwen 生态的 Skill 托管与分发开源方案,支持自建与可选 ClawHub 兼容。Python0239
热门内容推荐
最新内容推荐
项目优选
收起
暂无描述
Dockerfile
748
4.85 K
本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。
C++
640
1.26 K
Ascend Extension for PyTorch
Python
684
824
本项目是CANN提供的transformer类大模型算子库,实现网络在NPU上加速计算。
C++
832
1.82 K
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
449
412
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
1.02 K
1.03 K
Claude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed.
Get Started
Rust
1.49 K
171
CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体,本仓库为其提供可复用的 Skills 模块。
Python
927
553
暂无简介
Dart
995
256
昇腾LLM分布式训练框架
Python
172
211