(通讯员 汪文丽)2022年12月13日晚,应华中师范大学文学院桂子山人文论坛的邀请,北京大学中文系教授、博士生导师詹卫东先生为我校文学院、语言所的师生做了题为《从语法理论到语言知识工程》的学术讲座。根据防疫要求,讲座采取线上方式举行,由文学院张邱林教授主持,文学院、语言所共40余名师生参加了此次学术讲座。
讲座伊始,詹教授首先引用了人工智能领域著名学者Winograd在Language as a cognitive process这本书里面提出的关于语言学观念发展演变的四个阶段,并提出现阶段的语言学是基于数据科学的语言学。接下来,詹卫东教授主要从“为什么要构建语言数据资源”和“中文语言资源构建的具体案例:句法结构树库”两个方面展开报告。
提到“为什么要构建语言数据资源”,詹教授指出从我们现在实际的语言生活中,学界提到的诸如语言教育、语言研究、语言产业、信息产业、语言生活、语言保护等方面,都离不开语言数据资源,构建语言数据资源是十分有必要的一项工程。日前,大规模数字化语言资源发展迅速,但中文语言资源建设相对较少,我们亟需构建深加工、高质量的语言资源。
接着,他指出语言资源的建设就是建立语言形式与意义的对应关系。对此,詹教授对其团队所构建的“现代汉语句法结构信息标注树库”进行了详细的介绍。从树库构建到树库标注加工流程、树库标注中的语言结构层次及功能分类问题,詹教授都列举了精准的数据,并运用详实的语料和结构树的形式进行了演示说明。此外,詹教授从微观和宏观两个层面清楚地介绍了树库标记的原理,并对其应用于短语结构的层次歧义考察进行了结果分析。最后,詹教授总结道:语言资源建设是基础工作,它需要工程技术保障和跨学科平台的支撑,同时,它也能推动语言学理论研究,支持应用研究。
整场讲座持续了一个多小时, 讲座结束后,在场有同学就树库规模、数据库标注等问题向詹教授请教,詹教授耐心地给予了解答。最后,张邱林教授作总结。他指出,詹卫东教授的报告让我们深受启发,启发我们做本体研究时要多从形式化的角度去思考,帮助我们检验本体研究的科学性,促使形式与意义更好地结合,真正实现语言研究的目的,为语言研究打开了新视野。本次学术讲座在师生们的掌声中圆满结束。