首页
/ 【亲测免费】 搜狗新闻文本分类数据集SougoCS介绍

【亲测免费】 搜狗新闻文本分类数据集SougoCS介绍

2026-01-30 04:54:11作者:劳婵绚Shirley

搜狗新闻文本分类数据集SougoCS是一个包含11类搜狐新闻文本的资源集合,总计近10万条新闻数据。本数据集由搜狗公司提供,原始数据格式为未分类的XML。为了方便用户使用,我们已经完成了XML的解析与分类工作。

该数据集涵盖了搜狐新闻的多个类别,包括但不限于时政、娱乐、体育、财经等,为研究人员和开发者提供了丰富的文本分类训练和测试材料。

以下是数据集的主要特点:

  • 数据格式:经过解析和分类的文本数据,易于直接加载和使用。
  • 类别丰富:包含11个新闻类别,满足多样化的研究需求。
  • 数据量大:近10万条新闻文本,有助于构建和训练高性能的文本分类模型。

我们希望这个数据集能够为自然语言处理领域的研究者和开发者提供帮助,促进文本分类技术的发展和应用。

登录后查看全文
热门项目推荐
相关项目推荐