Promptfoo 0.103.10版本发布：增强AI模型测试与安全防护能力

2025-06-09 22:31:45作者：董灵辛Dennis

Promptfoo是一个专注于AI模型测试与评估的开源工具，它帮助开发者和研究人员系统地评估不同提示词(prompt)和AI模型的表现。通过提供标准化的测试框架，Promptfoo使得比较不同模型输出、优化提示词设计以及检测模型潜在风险变得更加高效和可靠。

最新发布的0.103.10版本在安全防护和测试能力方面带来了多项重要改进，主要包括新增的护栏(guardrail)检查功能、HTTP错误处理优化以及多项用户体验提升。这些更新进一步强化了Promptfoo作为AI开发流程中质量保障工具的地位。

核心安全特性增强

本次版本最显著的改进是引入了内置的护栏检查机制。护栏是AI系统中的安全边界，用于防止模型产生有害、偏见或不恰当的内容。新版本中：

内置护栏支持：现在可以直接在redteam测试中使用内置的护栏功能，无需额外配置外部服务。这简化了安全测试流程，使开发者能够更快速地识别潜在问题。
全面的日志记录：所有护栏检查结果都会被详细记录，便于后续分析和审计。日志内容包括触发护栏的具体内容、检查时间以及相关上下文信息。
改进的提示注入防护：对间接提示注入(indirect prompt injection)检测插件进行了优化，调整了提示格式，提高了检测的准确性和可靠性。

这些安全特性特别适用于需要对AI系统进行红队测试(red teaming)的场景，帮助开发团队在部署前发现并修复潜在的安全问题。

新版本在多方面提升了系统的稳定性和错误处理能力：

HTTP错误处理优化：对HTTP提供程序进行了重大改进，现在能够更优雅地处理非2xx状态码的响应。新增了validateStatus配置选项，允许用户自定义哪些HTTP状态码应被视为有效响应。
状态管理修复：解决了UI中状态管理(stateful/stateless)设置不一致的问题，确保用户的选择能够正确持久化到配置文件中。
自动刷新机制：Web界面现在会自动检测并加载新的评估结果，无需手动刷新页面，提升了用户体验。