首页
/ cnews中文文本分类数据集

cnews中文文本分类数据集

2026-02-01 05:20:10作者:虞亚竹Luna

简介

cnews中文文本分类数据集是由清华大学根据新浪新闻RSS订阅频道2005-2011年间的历史数据筛选过滤生成的。该数据集旨在为自然语言处理领域的研究者提供一份高质量的中文文本分类训练数据。

数据集描述

  • 数据来源:新浪新闻RSS订阅频道2005-2011年间历史数据
  • 筛选过滤:由清华大学进行筛选和过滤
  • 训练过程:具体训练过程可参考创建者的博客文章

使用说明

请确保在使用此数据集时遵守相关法律法规,并尊重数据来源的版权。数据集仅限于学术研究使用,不得用于商业用途。

版权声明

此数据集基于公开来源的数据生成,版权归原始数据来源所有。使用时,请遵守相应的版权规定。

最后更新

本README文档最后更新于[[今天日期]]。数据集的版本更新和具体内容变更,请关注本仓库的更新动态。

登录后查看全文
热门项目推荐
相关项目推荐