(通讯员:张会萍 陆方喆)3月16日下午,浙江大学求是特聘教授、国际世界语学院院士刘海涛老师做客第214期桂子山人文论坛,为大家带来了“大数据时代的语言研究:距离与方向”的主题讲座,讲座由陆方喆老师主持,吸引了校内外众多老师和学生参加。
讲座伊始,刘海涛教授向大家介绍了大数据的重要性及必要性,他认为“大数据将为人类的生活创造前所未有的可量化的维度”、“大数据正在改变我们的生活以及理解世界的方式,成为新发明和新服务的源泉”。接着,刘教授便引入数据在语言研究方面发挥的作用,并提出在人工智能时代只有加入智能浪潮,语言研究才能得到新的发展。
在谈到语言学研究的转向问题时,刘教授提到了“怎样算一个受过良好训练的语言学家”的问题和“树库”的概念。树库是机器学习人类语言知识的来源,树库标注是人类语言知识外化的过程,所以受过良好训练的语言学家应当使用真实的语料进行研究。刘教授根据自己的研究经历,介绍了从依存距离出发,如何对人类语言作为一种复杂适应系统的普遍性与特殊性进行探索,并介绍了一些相关的成果,如梁君英、刘海涛的《语言学的交叉学科研究:语言普遍性、人类认知、大数据》(2016)、刘海涛、林燕妮的《大数据时代语言研究的方法和趋向》(2018)。
在讲座最后,刘海涛教授强调了三点:(1)用依存距离将语言与认知联系在一起,可以通过文本的计量来进行语言与认知的研究;(2)用依存方向可以进行基于真实语言材料(大数据)的语言(语序)类型研究;(3)利用复杂网络可以进行基于真实语言材料(大数据)的语言(形态)类型研究。
整个讲座过程中,刘教授语言风趣幽默,现场座无虚席,气氛十分热烈。这次讲座不仅开阔了大家的视野,也向大家传达了语言研究需要科学化与国际化的理念。