首页
/ 【亲测免费】 ChnSentiCorp中文情感分析 酒店评论语料

【亲测免费】 ChnSentiCorp中文情感分析 酒店评论语料

2026-02-01 04:05:02作者:史锋燃Gardner

简介

本仓库提供的资源文件是谭松波收集整理的酒店评论语料,是进行中文情感分析的重要数据集。该语料来源于携程网,经过自动化采集和整理,形成了包含10000篇评论的较大规模语料库。

语料构成

语料库被细分为以下四个子集,以适应不同需求:

  1. ChnSentiCorp-Htl-ba-2000:平衡语料,包含正负情感评论各1000篇。
  2. ChnSentiCorp-Htl-ba-4000:平衡语料,包含正负情感评论各2000篇。
  3. ChnSentiCorp-Htl-ba-6000:平衡语料,包含正负情感评论各3000篇。
  4. ChnSentiCorp-Htl-unba-10000:非平衡语料,其中正类评论7000篇。

注意事项

  • 本语料库仅供研究用途,不得用于商业目的。
  • 使用本语料库的研究成果发表时,应遵循学术规范,对数据来源进行明确标注。
  • 用户应保证在处理和存储语料时符合相关的数据保护法规和安全标准。

感谢您对本数据集的关注,希望它能为您的学术研究提供帮助。

登录后查看全文
热门项目推荐
相关项目推荐

项目优选

收起