首页
/ chisp:CSpider的脚本和基准

chisp:CSpider的脚本和基准

2026-02-01 05:04:32作者:卓艾滢Kingsley

CSpider 是一个大型中文数据集,旨在用于复杂的跨域语义解析和文本到SQL任务(关系数据库的自然语言接口)。本仓库提供了用于评估、预处理以及本文中使用的所有基准的代码。

数据集简介

CSpider 数据集与EMNLP 2019论文一同发布,包含了多样化的中文问题,这些问题涉及多个领域,需要模型具备较强的语义理解和逻辑推理能力。

仓库内容

  • 评估代码:用于对模型进行性能评估的代码。
  • 预处理代码:用于数据预处理和格式化的代码。
  • 基准数据集:用于训练和测试的基准数据。

更改日志

  • 10/2019:开始使用转换的完整数据集进行中文文本到SQL任务。提交教程和数据集使用说明可在相关文档中找到。
  • 9/2019:根据Spider的训练和部署集重新定义了在EMNLP 2019论文中使用的数据集。数据集已发布,用于重现论文中的结果。

引用

当您使用CSpider数据集时,请在文章中引用以下内容:

[文章标题]

请根据具体论文要求调整引用内容。

登录后查看全文
热门项目推荐
相关项目推荐