首页
/ 文本分类语料(复旦)训练集+测试集

文本分类语料(复旦)训练集+测试集

2026-02-01 05:09:40作者:薛曦旖Francesca

本文档提供了一份文本分类的语料资源,该资源来自于复旦大学。该语料库包含9833篇文档,分为训练集和测试集两部分,其中训练集包含9804篇文档。这些文档被均匀地划分到20个不同的类别中,训练集和测试集的比例约为1:1。

文件结构

  • train:训练语料文件夹,包含用于模型训练的文档。
  • test:测试语料文件夹,包含用于模型测试的文档。

注意事项

  • 请确保在处理和引用这些数据时遵循相应的使用规范和版权政策。
  • 文档中的文本内容均为中文,使用时请注意编码格式的一致性。
  • 本资源不包含任何形式的链接,请确保在合法范围内使用数据。

此资源旨在为文本分类研究提供基础数据支持,希望能够对相关研究人员和开发者有所帮助。

登录后查看全文
热门项目推荐
相关项目推荐