Promptfoo 0.112.8版本发布：多语言组合与安全测试增强

2025-06-09 14:37:31作者：宗隆裙

Promptfoo是一个专注于AI提示工程和模型评估的开源工具，它帮助开发者系统地测试、比较和优化不同AI模型的提示效果。该工具支持多种主流AI提供商，并提供丰富的评估指标和测试策略。

多语言组合功能升级

本次版本最显著的改进是引入了多语言组合功能。开发团队对多语言策略进行了深度优化，显著提升了其性能和可靠性。具体来说：

原有的"other-encodings"策略被拆分为独立的摩尔斯电码和猪拉丁语策略，这种模块化设计使得每种编码策略可以单独使用和优化
在安全测试场景中，系统现在能够正确处理多语言进度条的显示问题，确保用户界面与命令行状态保持一致
针对多语言测试场景，优化了测试计数逻辑，确保在多策略并行执行时能够准确统计测试用例数量

安全测试与评估改进

在安全测试方面，本次更新包含多项重要修复：

视频测试中存在的潜在问题得到解决，消除了可能导致测试中断的隐患
评估选项在YAML编辑器中的移除操作现在能够正确执行
afterAll钩子函数现在能够获取完整的测试结果上下文，为测试后处理提供了更全面的数据支持
测试计数逻辑在多策略场景下的准确性得到提升

提供商支持与模型更新

在模型提供商支持方面，本次更新包含以下改进：

AI21实验室的响应验证机制得到增强，确保API返回结果的正确性
新增对OpenAI codex-mini-latest模型的支持
OpenAI聊天模型别名现在使用最新的默认模型配置
默认模型ID已更新以符合最新的命名规范

开发者体验优化

针对开发者体验，本次更新做了多项改进：

文档页面新增Markdown格式复制按钮，方便开发者快速获取示例代码
评估对话框现在会显示当前选中的评估配置，提高操作的可视化程度
提示后缀的帮助文本进行了更新，使其更加清晰易懂
结果共享时的内存使用效率得到优化
Google Sheets数据获取现在使用代理助手，提高了可靠性

文档与测试增强

文档方面进行了多项改进：

新增医疗代理的curl使用示例
CLI文档内容得到更新
代码块标题格式进行了标准化处理
所有示例项目的README文件都添加了统一的初始化命令

测试覆盖范围继续扩大：

新增了安全测试发现和生成命令的单元测试
添加了AI21提供商模块的单元测试
评估命令和评估辅助函数的测试覆盖率得到提升

性能与稳定性

本次更新还包含多项底层优化：

密码学在SageMaker提供商中的使用更加简化
远程MCP服务器的头部支持得到增强
依赖项更新至最新稳定版本
遥测系统的密钥配置问题得到修复

Promptfoo 0.112.8版本通过这些改进，进一步巩固了其作为AI提示工程和模型评估领域领先工具的地位，特别是在多语言处理和安全测试方面的能力得到了显著提升。开发团队持续关注开发者体验和系统稳定性，使得该工具在复杂AI应用开发中变得更加可靠和易用。

登录后查看全文

热门内容推荐

1 编程实践项目探索指南：从零构建技术能力体系 2 技术解构式学习：从0到1构建你的编程知识体系 3 构建自己的技术世界：build-your-own-x项目的实践探索指南 4 解锁编程技能的实践之旅：从零构建你的技术世界 5 技术实践探索：从零开始构建核心系统的实践指南 6 亲手锻造技术引擎：从0到1构建核心系统的实践指南

最新内容推荐

AcFunDown视频下载工具完全指南还在为数字笔记抓狂？这款开源神器让手写批注效率提升300%Windows笔记本电池健康管理全指南：从根源解决电池损耗问题 gmx_MMPBSA分子间相互作用索引错误的深度诊断与解决 Axure RP 11 本地化方案：Mac中文界面优化与原型设计工具汉化全指南如何高效获取教育资源？这款工具让教材下载效率提升80%视频元数据深度编辑：专业技巧与案例网盘直链下载技术解析与应用指南如何用DeepSeek-R1推理模型提升复杂任务解决能力：完整指南 5个突破瓶颈技巧：硬件优化工具让你的电脑性能提升30%

项目优选

收起

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

flutter_flutter

Oohos_react_native

React Native鸿蒙化仓库

昇腾LLM分布式训练框架

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统