首页
/ 【亲测免费】 中文人名语料库(Chinese-Names-Corpus)

【亲测免费】 中文人名语料库(Chinese-Names-Corpus)

2026-01-30 05:16:29作者:幸俭卉

简介

中文人名语料库(Chinese-Names-Corpus)是由业余项目“萌名NameMoe”产生的副产品,旨在为中文分词和人名实体识别提供丰富的数据资源。本库包含了大量中文姓名、姓氏、名字、称呼,以及日本人名和翻译人名等,是人名生成和自然语言处理领域的重要资料。

数据详情

中文常见人名(Chinese_Names_Corpus)

  • 数据大小:120万
  • 语料来源:从亿级人名语料中提取
  • 数据清洗:已清洗,但可能仍有少量badcase

中文古代人名(Ancient_Names_Corpus)

  • 数据大小:25万
  • 语料来源:多个人名词典汇总
  • 数据清洗:已清洗

中文姓氏(Chinese_Family_Name)

  • 数据大小:1千
  • 语料来源:从亿人名语料中提取
  • 数据清洗:已清洗

中文称呼(Chinese_Relationship)

  • 数据大小:5千
  • 语料来源:称呼词根

使用说明

本语料库可用于中文分词、人名识别等自然语言处理任务。在使用过程中,请遵守以下规定:

  1. 请勿将本库打包上传其他网站挣积分。
  2. 如果已上传,请配合删除,谢谢!

感谢您的理解与支持,希望本资源能为您的相关研究带来帮助。

登录后查看全文
热门项目推荐
相关项目推荐