文学不是科学 更不是玄学
时间:2022-07-14 来源: 作者:[db:作者]  浏览次数:
我在大学教了几年古代文学,发现年轻学生对这门课往往抱有不切实际的幻想。其他专业的同学认为诗词歌赋很浪漫,可以作为实验中写代码背公式的调剂,欣然将其设为跨专业学分的第二选择。还没进这个专业的同学认为诗词歌赋是在背文学常识。李白飘逸,杜甫沉郁,二十个形容词可以涵盖两千年的作者,帮助别人从大学拿到博士学位。我常常想,如果这是中文系的日常,大学还不如取消这个专业。任何一个有文化的人,穿着汉服,戴着镯子,喝着小瓶装的酒,挥舞着小扇子,迎着风哭,对着月亮伤心,念叨着最后一句话,如果人生只是第一次,难道不能低成本的满足自己心中的文艺幻想吗?
是的,每个人都有欣赏文学的权利,但不是每个人都有研究文学的能力。中文系期待的从来不是一个充满文学幻想的文艺青年或者死记硬背的学霸,而是一个思路清晰,逻辑严密的研究者。如果一个人能学好数学和逻辑,又非常热爱艺术,学文学再合适不过了。——因为文学是一门作为研究对象的艺术(不能背),而通向文学的研究方法必须符合学术伦理(不能吹)。3354严密的逻辑是最基本的学术伦理。窃窃私语,超灵文本的顿悟,这属于文学对个体生命的影响。我们欣赏文学对生活的力量,但这毕竟不同于学习文学。
作者写诗,可能是因为某种情绪;但他写的是这首诗而不是那首,这是他所拥有的技术决定的。我们对生活的感受未必比杜甫少,对山川的热爱未必比王维少。我们只能做圈圈,拍照留念,因为盖没有习得杜甫和王维的表现手法。没有技术谈感动的是普通读者;是懂技术,不忘感动的文学研究者。
但是,文学爱好者,包括一些文学研究者,总有一种旧的傲慢,认为技术分析是低端的、附庸风雅的,同时对一些“技术手段”的入侵相当警惕。事实上,在科学主义盛行的时候,大家都曾狂热地拥抱过表格和数据,甚至有时候,拥抱的姿态太过急迫,以至于不优雅。但是,这次也不一样,就像父母逼着孩子读《十万个为什么》一样。现在的家长都是逼着孩子背四书五经。在大趋势下,各种与文学研究者格格不入的技术手段难免被冷落。所以我常常怀疑,一种人文社会科学的研究方法要想在中国流行,必须同时满足两个条件,一是从国外引进,二是与国内环境合拍。从这个角度来看,近年来人文学科低温发酵的大数据挖掘,似乎只满足后一个条件。以后能不能成大气候,真的让人捏一把汗。
想到数据挖掘是因为偶然在网上看到一个帖子,叫《计算机告诉你,唐朝诗人之间的关系到底是什么样的?》(以下简称《诗人关系》)。因为和我的工作有关,所以忍不住感兴趣。本研究的思路大致是通过哈佛大学整理的《中国历代人物专辑资料库》(中国传记数据库项目)提供的诗人姓名数据,计算出4万多首唐诗中诗人之间的引用关系,从而构建唐代诗人的交往网络。正如网上一些评论所说,作者通过新的(针对文学研究的)手法得出的最终结果,大致符合文学史的旧认知。但在我看来,符合文学史上已有的认知,并不意味着研究就没有价值。这种巧合既检验了彼此的正确性,也说明由于唐诗总量不大,计算机对这些数据的处理并没有明显超过人脑的优势。3354如果你把它换成清代诗歌,我肯定它能捕捉到一个小范围的社会现象
我不认为《诗人关系》是一个完美的学习。首先,有一些小问题。比如“引用”本身,仅仅靠人名(名字、台词、昵称)是无法捕捉3354的。你看到的可能是一个集合名词,像杜甫《同诸公登慈恩寺塔》里的“朱功”。(根据杜甫的自我注释和现存的唐诗,我们知道“朱功”至少包括高适和薛植。比如不排除“伪引”3354,比如李商隐沿袭杜氏风格写的《早朝大明宫呈两省僚友》,李贺特色写的《杜工部蜀中离席》,并不代表李商隐和他两位死去的前辈有什么关系。
那么就有一个很大的问题:《效长吉》混淆了“诗人关系”、“诗人引用关系”、“诗人社交网络”三个不同的概念。“诗人引用关系”只是“诗人关系”的一种类型,而“诗”
人共作关系”呢——假设老王和老李去老张家,各赋《老张》一首,两篇《老张》就能说明王李“诗人关系”的存在。实际上,在诗成为士人流行交际手段的唐代社会,《老张》这种同场合共作诗非常之多,像褚遂良、上官仪、岑文本、杨续、刘洎和许敬宗都有一首《安德山池宴集》,就是他们在安德公杨师道家宴游所作的,这种作品也一样能反映(不同程度的)交际的发生。再者“诗人关系”又只是“诗人社交网络”的一个类型而已,诗人老王和诗人老李好了一辈子,不曾有一首诗往还,也没有什么不可以,写诗本不是诗人社交的唯一方式——换言之,诗对于构拟“诗人社交网络”,就是一个不充足的样本。
应该说,《诗人关系》在方法设计、数据库搭建及人工判别筛选剔除上,都存在些许问题,目前的工作只是为研究唐代诗人交往情况做了一些前期准备,提供了一些可以进一步分析的数据,而全部工作还远没有完成。但我认为以上这些问题,应该责之文学研究者去解决,而不应该责之为我们提供这个方法的人。打个比方,当文学研究和数据挖掘相遇时,他们的关系就好比医生和医疗器械工程师,各自都要对对方的工作懂一点,才好相互合作,但谁也不可能取代谁。
不错,大数据是把好用的柳叶刀。《诗人关系》的作者还用这把刀做过唐诗用字、用词(季节、颜色、植物、动物)等数据分析(《当我们在读唐诗时,我们在读什么?》,下面简称《读唐诗》)。如果说《诗人关系》是对文学的外部研究的话,《读唐诗》则是文学文本的内部分析。这种分析取径也是古已有之,我们说杜甫喜欢用乾坤、天地、万古、宇宙之类的大词,李贺喜欢用各种颜色,这都是古今文学研究者总结出来的文学现象,所谓总结,其实就是一种算法,通过这种算法,我们能把握诗人创作的某些特点。我读大学的时候,我的老师考学生的一个办法,是找几首名家写的不那么常见的诗(相对于本科生的阅读量),让大家猜作者。猜,其实就是对诗人的用词、语法、章法习惯的一个综合计算。而古人习诗,特重拟作,模拟一篇作品,其实和读作品猜作者一样,也得先对诗人的用词、语法、章法习惯做综合计算。