PyRIT v0.9.0发布：红队AI测试框架的重大更新

2025-06-18 21:47:17作者：苗圣禹Peter

The Python Risk Identification Tool for generative AI (PyRIT) is an open source framework built to empower security professionals and engineers to proactively identify risks in generative AI systems.

项目地址：https://gitcode.com/GitHub_Trending/py/PyRIT

项目概述

PyRIT是由微软Azure团队开发的开源红队AI测试框架，旨在帮助安全研究人员和开发人员评估大型语言模型(LLM)的安全性。该框架提供了一套完整的工具链，用于自动化测试AI系统的漏洞、生成对抗性提示、评估模型响应等。PyRIT特别适合用于红队演练，帮助组织发现和修复其AI系统中的潜在安全风险。

核心功能更新

目标模块增强

HTTPTarget模块进行了多项改进，包括正确解析HTTP版本、自动计算内容长度以及使标头不区分大小写。这些改进使得与Web服务的交互更加可靠和标准化。RealtimeTarget修复了IndexError问题，现在能够正确处理响应数据。

数据集扩展

本次更新引入了两个重要的数据集：

社会工程学(说服与欺骗)场景数据集，位于datasets/orchestrators/red_teaming/persuasion_deception路径下，包含用于测试模型在说服和欺骗场景下行为的样本。
多语言漏洞数据集，来自"A Framework to Assess Multilingual Vulnerabilities of LLMs"研究，帮助评估模型在不同语言环境下的安全表现。

转换器新增功能

AsciiSmugglerConverter增加了两种隐藏数据编码方法：直接嵌入Unicode字符(默认使用😊表情)和在可见文本后附加隐藏数据。新增的ZalgoConverter可以向文本添加Unicode字符，制造"故障"效果。ToxicSentenceGeneratorConverter则能根据种子提示生成有毒句子开头。

编排器重构

MultiTurnAttackResult被重命名为OrchestratorResult，这是对目标和结果处理方式进行大规模重构的一部分。PromptSendingOrchestrator现在会保留提供的会话ID，提高了对话连续性。CrescendoOrchestrator移除了特定危害预防机制，使测试更加灵活。

评分系统改进

新增了SelfAskGeneralScorer通用评分器，支持配置不同的评分类型(如True/False、浮点数)并能使用系统提示和格式字符串格式化提示。Criteria-Based Scorer与SelfAskScaleScorer配合使用，提供针对特定目标的评估标准。CompositeScorer可将多个True/False结果合并为单一结果。

依赖项优化

将jupyter和ipykernel从必需依赖项移至可选的[dev]依赖项，减少了基础安装的包体积。azure-cognitiveservices-speech也从必需依赖项移至可选的[speech]依赖项，使框架更加模块化。

其他重要改进

新增了自定义文件名支持，允许将数据(图像、音频、视频等)以指定名称保存到存储中。pyrit_custom_result_retry自定义重试装饰器可以在特定条件为真时重试函数，补充了现有的基于异常的重试机制。开发容器(devcontainer)进行了多项优化和错误修复，提升了开发体验。

技术影响与价值

PyRIT v0.9.0的发布标志着该框架在AI安全测试领域的成熟度进一步提升。新增的社会工程学数据集和多语言漏洞评估能力，使研究人员能够更全面地测试模型在各种复杂场景下的表现。转换器功能的扩展为生成更复杂的对抗性输入提供了更多选择。评分系统的改进使得评估结果更加精确和灵活。

这些更新共同增强了PyRIT作为专业级AI红队测试工具的能力，使其能够适应更广泛的安全测试需求，从基础的内容过滤测试到复杂的多语言社会工程学攻击模拟。对于关注AI安全的研究人员和开发人员来说，这个版本提供了更强大的工具来识别和缓解潜在风险。

PyRIT

The Python Risk Identification Tool for generative AI (PyRIT) is an open source framework built to empower security professionals and engineers to proactively identify risks in generative AI systems.

项目地址：https://gitcode.com/GitHub_Trending/py/PyRIT

登录后查看全文

PyRIT v0.9.0发布：红队AI测试框架的重大更新

项目概述

核心功能更新

目标模块增强

数据集扩展

转换器新增功能

编排器重构

评分系统改进

依赖项优化

其他重要改进

技术影响与价值

最新内容推荐

项目优选

PyRIT v0.9.0发布：红队AI测试框架的重大更新

项目概述

核心功能更新

目标模块增强

数据集扩展

转换器新增功能

编排器重构

评分系统改进

依赖项优化

其他重要改进

技术影响与价值

相关内容推荐

最新内容推荐

项目优选