【亲测免费】古诗词大数据集：唐诗、宋词、元曲

2026-02-01 04:21:14作者：宗隆裙

这是一个极其全面的古诗词大数据集，涵盖了中国文学宝库中的精华，从先秦时期到现代，共计收录超过85万首古诗词。数据集以CSV格式存储，包含唐诗、宋词、元曲等各个朝代的经典作品，适用于学术研究、教育用途、文本分析及诗词创作灵感来源。通过这份数据集，您可以深入探索中国古典文学、诗词格律、历史文化及语言艺术的深厚底蕴。无论是研究者还是爱好者，都能从中获得宝贵的资源，弘扬中国传统文化，感受古典诗词的无穷魅力。

项目地址：https://gitcode.com/Premium-Resources/c8b0e

简介

本资源是一个包含极其全面的古诗词数据集，以CSV格式存储。数据集涵盖了中国文学宝库中的精华，从先秦时期到现代，共计收录了超过85万首古诗词。这份资料集是研究中国古典文学、诗词格律、历史文化及语言艺术的宝贵资源。

数据内容

数据集包含以下朝代的古诗词：

朝代	诗词数	作者数
宋	287114	9446
明	236957	4439
清	90089	8872
唐	49195	2736
元	37375	1209
近现代	28419	790
当代	28219	177
明末清初	17700	176
元末明初	15736

使用说明

数据以CSV格式存储，可使用常用的数据处理软件或编程语言进行读取和分析。
数据集适用于学术研究、教育用途、文本分析、诗词创作灵感来源等。
请遵循相关法律法规，合理使用数据，尊重版权。

注意事项

请勿用于商业目的。
请勿传播含有不正确、不完整或误导性信息的数据。
数据集所含信息可能存在偏差，请在使用前进行核实。

本数据集旨在弘扬中国传统文化，为研究者和爱好者提供便利。希望这份古诗词全集能够成为您探索中国古典文学世界的良伴。

古诗词大数据集唐诗宋词元曲

项目地址：https://gitcode.com/Premium-Resources/c8b0e

登录后查看全文

项目优选

收起

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

471

473

pytorch

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

Dart

1.04 K

272

【亲测免费】古诗词大数据集：唐诗、宋词、元曲

简介

数据内容

使用说明

注意事项

热门内容推荐

最新内容推荐

项目优选

【亲测免费】 古诗词大数据集：唐诗、宋词、元曲

简介

数据内容

使用说明

注意事项

相关内容推荐

热门内容推荐

最新内容推荐

项目优选

【亲测免费】古诗词大数据集：唐诗、宋词、元曲