DeepEval测试框架新增关键参数支持：优化工具调用验证流程

2025-06-04 01:59:52作者：董宙帆

在自动化测试领域，DeepEval作为专为LLM应用设计的测试框架，近期针对其测试用例管理功能进行了重要升级。本次升级主要增强了.add_test_cases_from_json_file()和.add_test_cases_from_csv_file()两个核心方法的功能完整性。

功能升级背景

在LLM应用测试中，工具调用验证是评估模型行为准确性的关键环节。原始版本的DeepEval虽然支持通过LLMTestCase类构造测试用例时指定工具调用相关参数，但在批量导入测试用例时却缺少对应参数的支持，导致开发者不得不手动修改库代码才能实现完整功能。

新增参数解析

本次升级新增了两个重要参数：

tools_called_key_name：用于指定JSON/CSV文件中记录实际工具调用的字段名
expected_tools_key_name：用于指定JSON/CSV文件中记录预期工具调用的字段名

这两个参数的加入使得测试用例的批量导入功能与LLMTestCase类的构造函数保持了参数一致性，实现了功能完整性的闭环。

技术实现价值

简化测试流程：开发者现在可以直接通过配置文件完整定义测试用例，无需再为工具调用验证编写额外代码
提升可维护性：测试用例定义与实现逻辑完全解耦，使测试套件更易于维护和扩展
增强可读性：通过在配置文件中显式声明工具调用预期，测试意图更加清晰明确

典型应用场景

假设我们需要测试一个支持天气查询的对话系统，现在可以通过如下JSON结构定义测试用例：

{
  "query": "北京明天天气如何",
  "expected_output": "将为您查询北京明日天气",
  "tools_called": [
    {"name": "get_weather", "parameters": {"location": "北京", "date": "明天"}}
  ],
  "expected_tools": [
    {"name": "get_weather", "parameters": {"location": "北京", "date": "明天"}}
  ]
}