首页
/ 【亲测免费】 泰坦尼克号数据集

【亲测免费】 泰坦尼克号数据集

2026-01-30 05:23:26作者:邬祺芯Juliet

泰坦尼克号数据集是数据分析领域的一个经典数据集。本数据集源于历史上著名的海难事件——泰坦尼克号沉船事件。1912年4月15日,泰坦尼克号在其处女航中与冰山相撞后沉没,船上2224名乘客和机组人员中,1502人不幸遇难。这场悲剧引起了国际社会的震惊,并推动了船舶安全规定的完善。海难发生的原因之一是乘客和机组人员没有足够的救生艇。尽管在此次事件中,有幸存者的运气成分,但某些因素显然影响了乘客的生存几率。本研究数据集旨在探讨这些影响因素。

数据集包含以下11个特征:

  • Pclass:乘客所持票类,分为lower、middle、upper三种
  • Survived:0代表死亡,1代表存活
  • Name:乘客姓名
  • Sex:乘客性别
  • Age:乘客年龄(有缺失值)
  • SibSp:乘客兄弟姐妹/配偶的个数(整数值)
  • Parch:乘客父母/孩子的个数(整数值)
  • Ticket:票号(字符串)
  • Fare:乘客所持票的价格(浮点数,0-500不等)
  • Cabin:乘客所在船舱(有缺失值)
  • Embark:乘客登船港口,分为S、C、Q(有缺失值)

使用此数据集,您可以进行多种数据分析,如数据清洗、特征工程、建立预测模型等,以探索影响泰坦尼克号乘客生存的因素。希望这个数据集能为您的学习和研究带来帮助。

登录后查看全文
热门项目推荐
相关项目推荐