首页
/ 大众点评中文短文本情感分类数据集

大众点评中文短文本情感分类数据集

2026-01-31 04:54:35作者:裴麒琰

数据集简介

本数据集为大众点评中文短文本情感分类数据集,包含三分类(正面、负面、中性),且已进行人工标注。数据集旨在为研究人员和开发者提供一份可用于情感分析、文本挖掘等领域的参考资料。

数据特点

  1. 数据来源:数据来源于大众点评用户发表的评论。
  2. 数据规模:数据集包含若干条已分词的中文短文本。
  3. 数据标注:采用人工标注方式,将每条文本分为三个类别:正面、负面、中性。
  4. 乱码问题:请注意,使用WPS打开文件可能会出现乱码,但使用Python读取并无乱码问题。

使用说明

  1. 数据不平衡:数据集存在数据不平衡问题,使用时请注意。
  2. 读取方式:推荐使用Python读取数据,可以正常显示,无乱码问题。

注意事项

在使用本数据集时,请确保遵守相关法律法规,切勿用于非法用途。同时,请尊重数据来源和贡献者的劳动成果,合理使用数据集。

登录后查看全文
热门项目推荐
相关项目推荐