Back to projects
Mar 20, 2024
1 min read

Github开源项目-poetry

中国古代诗词库,收集了73281首古诗词和3156个诗人的数据。

这个古诗词数据库是2017年从古诗文网爬取下来的,目前的数据总量虽不及古诗文网,但其诗词数据进行了一定的清洗整理和格式化,方便给需要的人做研究或者做些创意。

推荐我开发的诗词学习网站,海棠诗社,古诗词的数字桃源。

数据结构

1.诗词数据

id是诗词在古诗文网上的索引(最近古诗文网改版了,已经不是用id了),name是诗词的名称,content是诗词的内容,dynasty是诗词的朝代,star是数据爬取时这首诗词的点赞人数,poet是诗人的信息,fanyi是诗词的注释和释义等数据,shangxi是诗词的赏析,about是关于这首诗词的其他内容,例如诗人的创作背景等,在古诗文网凡不是诗词释义和诗词赏析的内容都会归总到关于诗词的内容中。

{
  "about": "创作背景\n\n  唐玄宗天宝初年,李白xxx",
  "content": "君不见,黄河之水天上来,奔流到海不复回。xxx",
  "dynasty": "唐代",
  "fanyi": "译文\n你难道看不见那黄河之水从天上奔腾而来,波涛翻滚直奔东海,从不再往回流。xxx",
  "id": 7722,
  "name": "将进酒",
  "poet": {
    "desc": "李白(701年-762年),字太白,号青莲居士,唐朝浪漫主义诗人,被后人誉为“诗仙”。xxx",
    "id": 247,
    "image": "https://raw.githubusercontent.com/hujiaweibujidao/poetry/master/image/image_247.jpg",
    "name": "李白",
    "star": 0
  },
  "shangxi": "鉴赏\n\n  将进酒,唐代以前乐府歌曲的一个题目,内容大多咏唱饮酒放歌之事。xxx",
  "star": 32615,
  "tags": [
    "乐府",
    "唐诗三百首",
    "咏物",
    "抒情",
    "哲理",
    "宴饮"
  ]
}

2.诗人数据

id是诗人在古诗文网上的索引(最近古诗文网改版了,已经不是用id了),name是诗人的姓名,desc是诗人的简介,content是诗人的详细介绍,dynasty是诗人的朝代,star是数据爬取时这个诗人的点赞人数。

{
  "content": "轶事典故\n\n姓名由来\nxxx",
  "desc": "李白(701年-762年),字太白,号青莲居士,唐朝浪漫主义诗人,被后人誉为“诗仙”。xxx",
  "dynasty": "唐代",
  "id": 247,
  "image": "https://raw.githubusercontent.com/hujiaweibujidao/poetry/master/image/image_247.jpg",
  "name": "李白",
  "star": 4895
}