数据分析揭秘:唐朝诗人间有怎样的微妙社交关系

作者&投稿:曾景 (若有异议请与网页底部的电邮联系)
唐朝诗人间的关系有多复杂~

下图转自网路,可以参考:

李白生性狂放不羁,少时自以白衣卿相入仕,却不遂意,唯屈以文章自荐于相侯,所以亦谈不上是朋友,纯粹是应酬。其与杜甫,比之于伯牙子期亦不为过,历史上的两大文豪相遇,虽只是鲜有数面,然双方都以诗文的形式纪念下了那段珍贵的情谊,也成了中国文学史上的一桩美谈。
王右丞与裴迪,亦算一桩,早年隐居终南山,偃仰啸歌。
白乐天之于元微之,自然也是千古闻名。
韩愈与孟郊等等。文人相卿,自古皆然,同在志趣,惜才惜君。

数据分析揭秘:唐朝诗人间有怎样的微妙社交关系

数据侠
前进四先生 03-20 11:08

李白对杜甫的感情,远不及杜甫对李白的深?白居易才是唐诗圈里“大V”中的战斗机?除了吟诗作对,数据侠告诉你,关于唐诗我们还可以用数据分析来激扬文字,寻找那些流散在字里行间的人物关系。

用CBDB数据库,打开分析唐朝诗人关系的大门
前段时间随着《中国诗词大会》的热播,全国人民掀起了读唐诗的浪潮。在我还念中学的时候,每当心情不好,就靠读诗词来排遣。作为一名古典诗词爱好者,慢慢读得多了,就发现唐朝诗人之间存在着微妙的关系。
比如杜甫非常喜欢李白,到了做梦都想见李白的地步:三夜频梦君,情亲见君意(《梦李白》)。而李白向孟浩然表过白:吾爱孟夫子,风流天下闻(《赠孟浩然》)。孟浩然的好基友则是王昌龄:数年同笔砚,兹夕间衾裯(《送王昌龄之岭南》)。
出于好奇心,我一度想理清楚他们之间的关系。但是这件事主要有两个非常棘手的点:
全唐诗数量太多了,一共有四万多首。
诗人的别称太多,比如杜甫:按字称为子美,按排行称为杜二,按官职称为杜工部。整理起来非常麻烦。

针对第一点,我现在用计算机来做,即使数量再多也无所谓。
第二点则稍微费事一点,我们使用了哈佛大学编纂的《中国历代人物专辑资料库》(China Biographical Database Project 以下简称CBDB)。CBDB记录了中国历代名人的传记资料,并保存在关系型数据库中。
CBDB由很多张表组成,每张表记录了人物的不同信息。在我们这次的分析中,只用到了其中两张表,人物的主要信息表:BIOG_MAIN和人物的别名表:ALTNAME_DATA。首先从BIOG_MAIN中查询出人物编号c_personid,接着用c_personid从ALTNAME_DATA中查询出别名,如下图所示:

图中能够看到杜甫有三个别称:子美、杜二、杜工部。
当然也有很多重名的现象。比如我们查询王维时,会找出一堆叫王维的。

这个时候,我们就要使用生卒年来判定:这个人物到底是不是唐朝的。这次要从数据库中查询人物的生卒年。

唐朝建立于618年,灭亡于907年。对比后立刻发现,第二个王维才是我们要找的诗人王维。
查询别名核实一下:

看到了熟悉的王右丞和摩诘,没错,这正是王维同学。
由于CBDB收罗的历史人物太多,重名现象非常严重。经过一番探索,我最终设置了如下的排除重名策略:
如果人物生卒年俱全,那么只要生卒区间和唐朝持续时间有交集即可。如果存在这样的诗人,那么直接把这个人作为全唐诗中的作者。
如果人物只有生年或者卒年,那么生年或卒年必须在唐朝的持续时间内。将这样的人加入候选人列表。
如果人物生卒年都不详,那么舍弃之。
经过这三条判断之后:
如果候选人列表为空,那么说明CBDB中没有目标人选,舍弃这位诗人。
如果候选人多于一个,则说明排除重名失败,舍弃这位诗人。
这种策略并不完美,存在部分注明诗人被舍弃的情况。为此我手动添加了他们:

还有部分诗人的别称比较尴尬,属于唐诗中的常用词,需要手动去除。如下:

经过这一番筛选,全唐诗中原本的2609位作者,只剩下了762位。这就够了,著名的诗人都在这个列表当中,接下来我们只关心这762位诗人之间的关系。
李白不如杜甫重情义,白居易才是真“大V”
利用上面的诗人及别称列表,我们在全唐诗中来搜索诗人之间的引用关系。规则是:诗的标题和正文中只要提到过对方,那么两者之间的引用关系加1。一首诗如果提到多次对方,只算一次引用。
经过计算机一番运转,最终得到了引用关系表。
首先来检查一下李白和杜甫之间的引用关系:

不错,杜甫写了12首与李白有关的诗,李白则只有3首与杜甫有关的诗。李白这种朋友,确实差劲了一点啊......
从这张图也可以看出,我们的程序能够识别出诗人的别名,比如杜甫的《寄李十二白二十韵》和李白的《鲁郡东石门送杜二甫》都没有直接提到对方的名字。
除此之外,我还给诗人之间的引用关系排了个座次,下面显示了排名前三十的引用关系:

我们看到,全唐诗中排名第一的好基友绝对是陆龟蒙和皮日休。这两位互相提到对方的次数都在百次以上,这是因为陆龟蒙和皮日休特别喜欢唱和,你写一首送我,我再回一首赠你,跟现在微博大V之间的互动差不多。这两位常年唱和,最后将往来的唱和诗作编写了中国文学史上的第一本唱和诗集:《松陵集》。为了不辜负他们之间的友谊,文学史上通常将两者合称为“皮陆”。
并列第二的则是白居易和刘禹锡、白居易和元稹。白居易和刘禹锡同年(772年)出生,从政道路都是各种被贬谪。两人都很长寿,刘禹锡71岁时去世,白居易则活了75岁。白居易在得知刘禹锡去世的消息时,写下了千古名句:
“四海齐名白与刘,百年交分两绸缪。同贫同病退闲日,一死一生临老头。”
白居易和元稹我不想多写了,大家只要知道二人在文学史上被合称为“元白”,就能想见二者的亲密关系了。从排名前三十的引用关系来看,白居易绝对是唐朝诗人朋友圈中的明星,是大V中的大V。
唐朝诗人引用关系的社交网络
只有引用关系列表岂不是有些干巴巴的,接下来才是本文的重头戏。我将使用ECharts来可视化诗人之间的引用关系,最终得到诗人们的社交网络。
因为我们的样本中一共有762位诗人,为了避免画出的图太拥挤,看不清,我只将前一百的引用关系图示化,如下图:

箭头表示诗人们之间的引用关系。比如说白居易引用了元稹,那么就有白居易指向元稹的箭头,元稹引用了白居易,相应的也有元稹指向白居易的箭头。
箭头的粗细程度则表示了诗人们之间引用关系的强弱。白居易引用元稹的数量为167次,元稹引用白居易的数量为88次,那么白居易指向元稹的箭头就要粗一些。
图中清晰的显示除了唐朝诗人的两个大型朋友圈:杜甫-李白朋友圈、白居易朋友圈。没错,他们分别是盛唐和中唐两个时期的核心诗人。
虽然只画出了排名前一百的引用关系,但还是很拥挤。文学史上将唐诗根据时间划分为4个阶段:初唐、盛唐、中唐、晚唐。接下来我们就分别画出这四个阶段的社交网络图。
初唐诗人

从箭头的粗细来看,初唐诗人中关系最好的是宋之问和沈铨期。这两位正是宫廷诗人的代表,他们两位确定了近体诗的格律,对仗等规则。粗略的说,近体诗的规则就是他们俩发明出来的。对了,他们俩在文学史上一般也合成“沈宋”哦,看来要成为好基友,没有文学史的认证是不行的。
盛唐诗人

(图片说明:为了制图清晰,盛唐诗人社交网络只画出了引用数大于等于2的关系。)
盛唐诗人的核心无疑是“李杜文章在,光焰万丈长”中提到的李白和杜甫了。我们再次看到,杜甫指向李白的箭头比李白指向杜甫的箭头要粗得多。而且盛唐的诗人们明显分为两群,一群以李白-杜甫为核心,一群以皇甫冉和刘长卿为核心,为什么有这样的局面?我也不知道,有没有对文学史比较了解的朋友,请在评论里赐教。
中唐诗人

(图片说明:为了制图清晰,中唐诗人社交网络只画出了引用数大于等于2的关系。)
中唐诗人社交网的特征很明显,各位诗人紧紧团结在以白居易、元稹、刘禹锡为核心的“文坛政治局”周围,勠力同心,同舟共济,为唐诗从浪漫主义向现实主义的伟大转折做出了历史性贡献。
晚唐诗人

晚唐诗人的社交网络比较散乱,没有明显的核心。其中最重要的就是李商隐和杜牧了,他俩得到了文学史认证的“小李杜”好基友称号。
这篇文章写到这里,我突然意识到,即使一个人对唐诗没有任何了解,他只要看这些社交网络图,就能立刻发现哪位诗人是同时代诗人的核心,哪位诗人的影响最大。这些都是很有用的信息。
而我们可以用计算机来分析任何时代的人物关系。中国恰好是历史文献最全的国家,如果能对这些文献统一做系统的分析,岂不是可以做出随着时间变化的历史人物关系图?
这在以前是不可能的事,现在随着计算机技术的发展和古典文献的数字化进程,逐渐有可能了。这当然是很大的工作量,任何个人都不可能实现。我想,有没有可能参考linux的开发过程,用开源的方式,大家一起来完成这件事。


唐朝的时候诗歌的读音是哪种方言?
1. 唐代诗歌的读音与当时的方言有着密切关系,但由于历史上的语言变迁,直接对应唐代方言的语言已经不存在。2. 唐代的诗歌是用古代汉语写成的,这种语言与现代汉语存在差异。温州话作为一种保留了较多古老特征的方言,其文读方式在朗诵唐诗宋词时比普通话更为顺畅。3. 中古汉语是唐诗宋词所使用的语言形态...

唐诗通过什么流传开
余冠英先生曾分析七言诗在汉代为什么没能流行的原因:“一是两汉的那些七言中佳制太少……二是七言歌谣在汉时不曾有一首被采入乐府,没有音乐的力量来帮助它传播,自然难于普遍,后者应是最主要的原因。”[5]这从反面说明诗入乐传播的重要性。唐王朝统治者一直重视音乐等文化艺术的发展,唐朝各级政府...

举例分析论述大唐盛世有容乃大的文化气概?
3、唐朝是中国古代上承隋朝下启五代十国的朝代,由李渊建立。唐朝的文化一直占据中国重要历史的地位,一直有"唐诗宋词元代曲,明清两代小说佳"之说,而其中最辉煌的成就就是唐诗。唐朝诗届人物风流倜傥,无论是诗仙李白、诗圣杜甫,亦或是诗佛王维、诗鬼李贺等等,都有着自己独一无二的色彩。

张继的枫桥夜泊这首诗诗人半夜为什么睡不着?心里在愁些什么?
《枫桥夜泊》是唐代诗人张继的作品。唐朝安史之乱后,张继途经寒山寺时写下这首羁旅诗。深秋的一天,张继坐着船南下,准备前往苏州。夜已经很深了,小船正好行到了苏州城外,就停在了一座叫“封桥”的地方休息,准备第二天再赶路。已经是大半夜了,可是张继却怎么也睡不着,他心事重重,脑袋里想着,...

诗歌语言特色怎么分析,古代诗歌鉴赏之赏析语言风格
指小积石,在今甘肃临夏西北,即古唐述山。 2.本诗充分体现了边塞诗豪迈昂扬的格调,请结合全诗具体分析。 【答案】①在意象选取和意境营造上,选取“紫塞”“沙蓬”“边气”“戍烟”等边地特有的景象,展现了边塞雄浑、苍茫的特点,意象豪迈,营造出雄浑开阔的意境。 ②在人物形象塑造上,诗歌通过描绘“逐沙蓬”...

唐代诗人王维鉴赏
以上谈的是这首词的总体印象,为了印证这一印象,还可以从语言意象入手做进一步的分析。 “红酥手,黄縢酒,满城春色宫墙柳。”这三句抚今追昔,所表现的...我晕,王维是唐朝的,唐婉是宋朝的额。哥哥!是陆游吧国有一首家喻户晓的古诗《示儿》。诗是这么写的,"死去元知万事空,但悲不见九州同。王师北定中原日...

赞美葡萄酒的诗句唐代
1. 关于葡萄酒的唐代诗句 关于葡萄酒的唐代诗句 1.赞美葡萄酒的诗句 1,《过高逸人别墅》明代 林鸿 兹晨饮客青山墅,新压葡萄酒如乳。 绿树穿窗鸟...如此多的词汇,从另一个侧面也衬托出唐代酒文化底蕴的深厚。清楚了上述有关的酒名、酒器及与酒相关的词汇后,我们详细地来分析一下唐诗中描写的饮酒的一般...

历史\/唐朝
认真分析唐朝外交活跃的原因,可以得出如下结论①唐朝经济强大,国力强盛②唐朝政治相对清明,政局稳定③唐朝文化繁荣,影响力强④唐朝的对外交通发达⑤唐朝想要称霸世界... 认真分析唐朝外交活跃的原因,可以得出如下结论 ①唐朝经济强大,国力强盛 ②唐朝政治相对清明,政局稳定 ③唐朝文化繁荣,影响力强 ④唐朝的对外交通发达 ...

《西出阳关无故人》全首诗是什么?
《送元二使安西》是唐代诗人王维创作的七言绝句。此诗前两句写渭城驿馆风景,交待送别的时间、地点、环境气氛;后二句转入伤别,却不着伤字,只用举杯劝酒来表达内心强烈深沉的惜别之情。全诗以洗尽雕饰、明朗自然语言抒发别情,写得情景交融,韵味深永,具有很强的艺术感染力,落成之后便被人披以管弦...

唐代诗人李白的简介。。。越详细越好
李白(701年-762年),字太白,号青莲居士,中国唐朝诗人,自言祖籍陇西成纪(今甘肃省天水市秦安县),先世西凉武昭王李嵩之后,与李唐皇室同宗。幼时内迁,寄籍剑南道绵州(今四川省江油昌隆县)。李白有“诗仙”、“诗侠”、“酒仙”、“谪仙人”等称呼,活跃于盛唐,为杰出的浪漫主义诗人。与杜甫...

东洲区17351135391: 计算机分析,唐朝诗人之间的关系到底什么样 -
雕娥若奇: 空间大小如下word=short=2char=16bit字节就是char也是byte位是bit以上只是说空间,符号没有考虑

东洲区17351135391: 新风系统原理 -
雕娥若奇: 新风系统是根据在密闭的室内一侧用专用设备向室内送新风,再从另一侧由专用设备向室外排出,在室内会形成“新风流动场”的原理,从而满足室内新风换气的需要.实施方案是:采用高压头、大流量小功率直流...

东洲区17351135391: 简述汽车电气系统维修的注意事项有哪些 -
雕娥若奇: (一)点火系统方面应该注意的问题 首先,在检修过程中,务必要保证电子点火系统的搭铁良好.不管是传感器的搭铁、高压导线的搭铁、还是电子点火器的搭铁,其搭铁部位都必...

东洲区17351135391: 网络推广渠道有哪些? -
雕娥若奇: 模式总是千变万化,但万变不离其宗,不管那些推广渠道都只是为了一个共同的目标:销售额.一数据库营销数据库营销可包括IM推广、EDM邮件发送、SMS短信发送都属于线上电商推广常用方式,数据库营销通常对于销售额贡献度不大,...

东洲区17351135391: 简要分析唐诗兴盛的原因 -
雕娥若奇: 唐朝君主开放,经济发达,不同民族开始大融合.

东洲区17351135391: 综合性学习.  材料一:锄禾日当午,汗滴禾下土.谁知盘中餐,粒粒皆辛苦.  材料二:有关数据显示,我国消费者每年仅餐饮浪费的食物蛋白和脂肪就分别达... -
雕娥若奇:[答案] (1)本题主要考查信息的提取能力和语言的概括表达能力.解答本题时,要注意主要信息的提取. 材料一中,此诗出自唐朝诗人李绅《悯农》,通过描写农民务农的景象与心理反映了农民的辛苦. 材料二中,通过一组数据介绍了当前全球粮食供给不均衡. ...

东洲区17351135391: 我在excel中输入1 2 2 1 1 2 2 1 然后往下拉填充怎么显示的是1.5郁闷 怎么样才能让我像那样规律往下拉 -
雕娥若奇: 先写1 2 2 1,然后把四个单元格都选中,按着Ctrl下拉填充就可以了

东洲区17351135391: 外汇交易中技术面重要还是基本面重要? -
雕娥若奇: 汇查查认为这是个没有固定答案的问题,因为两者都适合大众.外汇交易技术面和基本面的关系是进行分析的时候要结合起来进行考虑的,投资者在这个时候需要把两者很好的进行配比之后再选择下一步的具体操作方法.对外汇交易员来说,不...

东洲区17351135391: 计算机的应用和分类分别有哪些? -
雕娥若奇: 一、计算机应用: 1、信息管理,是以数据库管理系统为基础,辅助管理者提高决策水平,改善运营策略的计算机技术. 2、过程控制,是利用计算机实时采集数据、分析数据,按最优值迅速地对控制对象进行自动调节或自动控制. 3、计算机...

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网