首页
/ 【免费下载】 垃圾短信中文数据集

【免费下载】 垃圾短信中文数据集

2026-01-24 05:39:29作者:咎岭娴Homer

简介

本仓库提供了一个名为“垃圾短信中文数据集.zip”的资源文件下载。该数据集包含了大量中文短信数据,适用于垃圾短信识别和相关研究。

数据集内容

  • 带标注数据:包含80万条中文短信,每条短信均带有标注,其中1表示垃圾短信,0表示正常短信。
  • 不带标注数据:包含20万条中文短信,这些短信未进行标注。

使用场景

该数据集适用于以下场景:

  • 垃圾短信识别模型的训练与评估
  • 中文自然语言处理研究
  • 短信分类算法的研究与开发

注意事项

  • 数据集仅供研究使用,请勿用于商业用途。
  • 数据集中的短信内容可能包含敏感信息,请谨慎处理。

参考

该数据集的构建参考了相关研究项目,具体信息可参考原始项目。

贡献

如果您对该数据集有任何改进建议或发现了任何问题,欢迎提交Issue或Pull Request。

许可证

本数据集遵循开源许可证,具体信息请参考LICENSE文件。

登录后查看全文
热门项目推荐
相关项目推荐