我对文学的热爱从上初中的时候就开始了。那时因为生病休学两年,一直在医院做治疗。有一次去医院住院,就在书店买了很多书带去。那应该是我第一次看那么多课外书籍,从此喜欢上了文学。在生病休学的两年时间里,我阅读了非常多文学作品,鲁迅、老舍……还有日本文学、拉美文学等,属于一个兼收并蓄的状态。
阅读文学作品让我有不同的角度去看待生活和看待世界。当时因为病情加重,我对生活、对自己的身体恢复有很多焦虑和压力,但这些作品和作家却让我很受启发。想到这个世界上有非常多精彩的人和精彩的生活,就激励我继续努力。另外,我自己身体不好,没办法去不一样的地方、感受不一样的生活,但我可以通过书籍去了解。所以当时阅读不是为了应试,也不是当作提高分数的技巧,而是抱着欣赏的态度去阅读。即使高中选择了理科,我对文学的热爱也没有改变。
我觉得文理其实不矛盾,是我们和世界交互的两种方式。理科告诉我们怎样从数学规律上去认识或去改造这个世界,但文科是告诉我们如何去感受这个世界。不管是学习还是做科研,文学对我起到了非常大的滋养作用。
比如博士生做研究,要求的是一种综合性的能力和素质,并不是论文发表就结束了。从设计模型推导数学公式,到写代码做实验,得出成果,写文章。文章写完需要在大众面前展示讲解,还要宣传科研成果。这里面不仅仅涉及理论能力,对表达能力、交流能力、写作能力都有非常高的要求。
我一直对文学感兴趣,自己也写过很多文章或者诗歌,由此我的表达能力和交流能力都得到了很好的锻炼。还有一个比较好的契机是我从高中就参加辩论,进清华之后也加入了校辩论队。四年多的辩论时间,我的表达能力尤其是思辨能力有非常大的提升。这些能力实际上都更好地帮我去做科研。
理科更多的是锻炼人的逻辑能力,写文章时会更有清晰的逻辑脉络、清晰的表达和结构。而在认识或是解决问题的时候,往往并不是一个简单的数学形式,或一个简单的物理形式。这时如果有一些文科的背景和经历,能让我做判断的时候更加合理或者说更人性化一些。这其实是文理科之间的交互。
在我们设计九歌(智能诗歌创作系统)的时候,并不只是在数学的理论里去进行公示推导和做模型设计,还会参考文学、语言学、心理学、认知科学的知识。比如,此前我们甚至从《文心雕龙》中得到启发,用这种启发指导整个模型设计的思路,优化诗歌写作系统。
一首诗歌在上下文上应有连贯性和整体性,但之前很多模型自动创作出来的诗歌是支离破碎的,一首绝句的前两句和后两句写的是完全不同的主题,两个主题之间没有任何衔接和过渡,这样对整个诗作的质量有非常大的影响。
所以我们想解决的就是如何提升所生成诗歌的连贯性和整体性。每一句诗需要和上文有紧密衔接和自然过渡,但也不能用规则约束得太死板,要有一定的自由和发挥的空间,这非常难。
《文心雕龙·章句》里有一段话:“裁文匠笔,篇有小大;离章合句,调有缓急;随变适会,莫见定准……故能外文绮交,内义脉注,跗萼相衔,首尾一体。若辞失其朋,则羁旅而无友;事乖其次,则飘寓而不安。”
这段话给我们的启发是,不需要事先设计好哪一部分怎么写,而是“随变适会,莫见定准”,在写的过程中,没有固定的计划或结构,而是动态、灵活地去构建一首诗的整体骨架,这可以对应到诗歌写作理论中的“意脉”这一概念。这个框架设计的要求就是既要和上文相关,但同时又不能有非常严格、生硬的约束,有一定的灵活性和自由发挥的空间,这是“形而上”给我们的启发。
根据这个启发我们再进行详细设计。在具体诗歌的生成过程中,会实时一句一句地自动生成。每生成一句,我们会设计一个算法,把里面的关键意象提取出来,在上文里保留这些关键意象,再用这些关键意象指导下文的生成。诗歌里会有很多虚词,在我们领域里叫停用词,比如“之”“又”“却”等对下文没有特别明显或者特别显著的意义。一般在计算机语言学里面,我们认为名词、形容词、动词等是有明显的语义特征,这些关键意象就会保留下来,用来引导下文的生成。
这首“鸿雁三千里,萍蓬七十年。乡情回首处,秋兴正堪怜。”是九歌创作的诗。我们的算法保留了第一句的关键意象——“鸿雁”,忽略了“三千里”。根据《文心雕龙·章句》的启发,如果上文留下的信息过多,反而会干扰模型。“鸿雁”是代表秋天的意象,第一句把“鸿雁”留下来,最后一句就生成“秋兴”,在季节上和意境上连贯,使得整首诗保持了完整的秋天意象。
通过对九歌的研究,我自己对诗歌和文学的理解也更加深入。以前在本科或高中阶段,我只是会去读古人的诗作,最多去看别人的赏析,对整个诗歌理论、文学理论没有探究。读了博士,研究诗歌的智能创作后,我更加系统地来学习诗歌和文学,此间,人文和理工科的内容实现了相互促进、相互驱动。为了要做生成诗歌的任务,就必须去了解诗词相关的知识,这些知识,反过来又有利于指导我们进行模型的设计。这是学科交叉起到的激励作用。
“孤篷一夜笛声中,回首江南万里风;我欲乘槎沧海去,与君同作钓鱼翁。”这是我自己比较喜欢的九歌创作出来的一首诗。机器偶尔确实会有一些让人惊艳的作品,这样的作品其实可以激励人的创作,使人从中得到启发,去提升写作能力。同样,这也激励着我们在人工智能写作领域作出更多的研究和更大的贡献。
(作者:矣晓沅,系清华大学计算机科学与技术系博士生,智能诗歌创作系统九歌开发团队成员,本文由本报记者杨飒采访整理)