chisp:CSpider的脚本和基准

2026-02-01 05:04:32作者：卓艾滢Kingsley

chispCSpider的脚本和基准

CSpider是一个专注于复杂跨域语义解析和中文文本到SQL任务的大型数据集，旨在推动自然语言处理领域的研究与创新。该数据集包含多样化的中文问题，涉及多个领域，要求模型具备强大的语义理解和逻辑推理能力。本开源项目提供了完整的评估代码、预处理工具以及基准数据集，帮助研究人员快速上手并进行模型性能测试。通过CSpider，您可以深入探索中文自然语言处理的前沿技术，提升模型在复杂场景下的表现。该项目与EMNLP 2019论文同步发布，为相关研究提供了坚实的实验基础和数据支持。

项目地址：https://gitcode.com/Premium-Resources/efd33

CSpider 是一个大型中文数据集，旨在用于复杂的跨域语义解析和文本到SQL任务（关系数据库的自然语言接口）。本仓库提供了用于评估、预处理以及本文中使用的所有基准的代码。

数据集简介

CSpider 数据集与EMNLP 2019论文一同发布，包含了多样化的中文问题，这些问题涉及多个领域，需要模型具备较强的语义理解和逻辑推理能力。

仓库内容

评估代码：用于对模型进行性能评估的代码。
预处理代码：用于数据预处理和格式化的代码。
基准数据集：用于训练和测试的基准数据。

更改日志

10/2019：开始使用转换的完整数据集进行中文文本到SQL任务。提交教程和数据集使用说明可在相关文档中找到。
9/2019：根据Spider的训练和部署集重新定义了在EMNLP 2019论文中使用的数据集。数据集已发布，用于重现论文中的结果。

引用

当您使用CSpider数据集时，请在文章中引用以下内容：

[文章标题]

请根据具体论文要求调整引用内容。

chispCSpider的脚本和基准

CSpider是一个专注于复杂跨域语义解析和中文文本到SQL任务的大型数据集，旨在推动自然语言处理领域的研究与创新。该数据集包含多样化的中文问题，涉及多个领域，要求模型具备强大的语义理解和逻辑推理能力。本开源项目提供了完整的评估代码、预处理工具以及基准数据集，帮助研究人员快速上手并进行模型性能测试。通过CSpider，您可以深入探索中文自然语言处理的前沿技术，提升模型在复杂场景下的表现。该项目与EMNLP 2019论文同步发布，为相关研究提供了坚实的实验基础和数据支持。

项目地址：https://gitcode.com/Premium-Resources/efd33

登录后查看全文

项目优选

收起

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

deepin linux kernel

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

flutter_flutter

昇腾LLM分布式训练框架

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统