首页
/ 已下架多模态情感分析数据集——CMU-MOSI数据集介绍

已下架多模态情感分析数据集——CMU-MOSI数据集介绍

2026-02-02 04:26:07作者:乔或婵

数据集概述

CMU-MOSI数据集是一个专门为多模态情感分析研究设计的资源库。该数据集利用了先进的预训练模型BERT对文本模态进行编码,同时使用Librosa工具对音频模态进行处理,并结合Open Face2.0对视频模态进行编码,最终将三种模态的数据整合并打包成pkl文件格式。每个样本都包含一个唯一的编号(ID)、视频(V)数据、音频(A)数据、文本(T)数据以及相应的情感标签(L),并以字典的形式保存在numpy文件中。

数据集结构

  • ID:每个样本的唯一标识符。
  • V:视频模态数据,经过Open Face2.0编码。
  • A:音频模态数据,使用Librosa编码。
  • T:文本模态数据,利用预训练的BERT模型进行编码。
  • L:情感标签,指示样本的情感倾向。

使用场景

CMU-MOSI数据集适用于多模态情感分析领域的研究工作,可以帮助科研人员更好地理解不同模态间的交互作用以及对情感识别的影响。数据集的多样性和高质量编码保证了其在学术研究中的实用价值。

注意事项

  • 本数据集已下架,请确保合法使用数据。
  • 数据使用过程中,请遵循相关法律法规及伦理准则。
  • 数据集打包为pkl格式,请确保您的环境支持该格式。

通过提供这一数据集,我们希望为多模态情感分析领域的研究提供便利,促进学术交流与合作。

登录后查看全文
热门项目推荐
相关项目推荐