首页
/ Promptfoo 0.112.5版本发布:提升配置解析与安全测试能力

Promptfoo 0.112.5版本发布:提升配置解析与安全测试能力

2025-06-09 02:37:27作者:冯梦姬Eddie

Promptfoo是一个专注于AI提示工程和模型评估的开源工具,它帮助开发者系统性地测试、比较和优化不同AI模型的提示效果。在最新发布的0.112.5版本中,项目团队针对配置管理、安全测试和错误处理等方面进行了多项改进,进一步提升了工具的稳定性和实用性。

核心功能优化

本次更新在配置解析方面做出了重要改进。Promptfoo现在能够正确处理相对路径配置,解决了在组合多个配置文件时可能出现的路径解析问题。这一改进使得项目配置更加灵活,特别是在大型项目中引用外部配置文件时,开发者不再需要手动调整路径设置。

对于使用Amazon Bedrock服务的用户,新版本优化了token计数功能,确保统计结果的准确性。同时,Bedrock提供商的配置现在能够与提示配置正确合并,简化了复杂场景下的配置管理。

安全测试增强

安全测试是Promptfoo的一个重要功能模块,本次更新在这方面做了多项优化:

  1. 改进了用户信息检测功能,减少了误报情况,使测试结果更加可靠。
  2. 优化了系统命令注入检测逻辑,同样减少了误报,提高了测试准确性。
  3. 在通过的安全测试中增加了策略标识和输出详情,使测试报告更加直观和易于理解。
  4. 调整了测试方法的排序方式,现在默认按照测试成功率降序排列,方便开发者优先关注高风险问题。

这些改进使得Promptfoo在检测AI模型潜在安全风险方面的能力更加精准和实用。

开发者体验提升

新版本在命令行工具方面做了多项优化,显著提升了开发者体验:

  1. 新增了全局的--env-file选项,允许所有子命令共享环境变量配置文件,简化了环境管理。
  2. 改进了远程生成功能(remote generation)的错误处理和日志记录,使调试过程更加顺畅。
  3. 优化了响应解析错误的处理方式,提供更清晰的错误信息。

对于Google AI Studio用户,新版本增加了对嵌入模型的官方支持,并完善了相关文档。同时,Amazon用户现在可以使用最新的Nova Premier模型。

文档与测试改进

项目文档在此次更新中得到了进一步完善:

  1. 新增了关于如何创建内联断言(inline assertions)的详细指南,帮助开发者更好地自定义测试逻辑。
  2. 更新了OpenAI结构化输出外部模式文件的示例,使这一高级功能更易于使用。
  3. 改进了文档构建和运行的说明,方便贡献者参与文档维护。

在测试方面,新增了针对用户信息检测模块的单元测试,提高了代码质量保证。同时,项目开始采用类型信息进行代码检查,进一步提升了代码健壮性。

Promptfoo 0.112.5版本通过上述多项改进,为AI提示工程和模型评估提供了更加稳定和强大的工具支持,特别是在配置管理、安全测试和开发者体验方面的优化,将帮助开发者更高效地构建和评估AI应用。

登录后查看全文
热门项目推荐

项目优选

收起
openHiTLS-examplesopenHiTLS-examples
本仓将为广大高校开发者提供开源实践和创新开发平台,收集和展示openHiTLS示例代码及创新应用,欢迎大家投稿,让全世界看到您的精巧密码实现设计,也让更多人通过您的优秀成果,理解、喜爱上密码技术。
C
53
465
kernelkernel
deepin linux kernel
C
22
5
openHiTLSopenHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
349
381
nop-entropynop-entropy
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
7
0
openGauss-serveropenGauss-server
openGauss kernel ~ openGauss is an open source relational database management system
C++
132
185
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
876
517
Cangjie-ExamplesCangjie-Examples
本仓将收集和展示高质量的仓颉示例代码,欢迎大家投稿,让全世界看到您的妙趣设计,也让更多人通过您的编码理解和喜爱仓颉语言。
Cangjie
336
1.1 K
ohos_react_nativeohos_react_native
React Native鸿蒙化仓库
C++
179
264
cherry-studiocherry-studio
🍒 Cherry Studio 是一款支持多个 LLM 提供商的桌面客户端
TypeScript
610
59
note-gennote-gen
一款跨平台的 Markdown AI 笔记软件,致力于使用 AI 建立记录和写作的桥梁。
TSX
83
4