内容摘要:北京大学中文系近日召开重大项目“多层次文本语义挖掘和事实内容抽取的理论研究、资源建设和系统开发”论证会,讨论北京语言大学语言资源高精尖创新中心项目的具体规划和任务分工,并就研究现状、技术优势和该项目的任务目标及其实施方式等诸多问题。在该项目中,北大团队所承担的工作在于聚焦“一带一路”政策规划,将旅游、财经具体领域的语言知识模块化、精细化,在汉语意合语法理论框架的指导下,以文本的深度语义分析为基础,利用基于“词库—构式”互动的汉语意合语法理论的汉语信息处理系统与资源。从实体、关系、事件、评价四个层次进行多层次文本语义挖掘和事实内容抽取的理论研究、资源建设和系统开发。
关键词:汉语;语法;事实内容抽取;文本语义挖掘;北大;理论研究;系统开发;语言资源;政策规划;资源建设
作者简介:
北京大学中文系近日召开重大项目“多层次文本语义挖掘和事实内容抽取的理论研究、资源建设和系统开发”论证会,讨论北京语言大学语言资源高精尖创新中心项目的具体规划和任务分工,并就研究现状、技术优势和该项目的任务目标及其实施方式等诸多问题,进行了详细、深入的分析。
在该项目中,北大团队所承担的工作在于聚焦“一带一路”政策规划,将旅游、财经具体领域的语言知识模块化、精细化,在汉语意合语法理论框架的指导下,以文本的深度语义分析为基础,利用基于“词库—构式”互动的汉语意合语法理论的汉语信息处理系统与资源,从实体、关系、事件、评价四个层次进行多层次文本语义挖掘和事实内容抽取的理论研究、资源建设和系统开发。
项目负责人提出,目前所构建的名词物性角色知识库可以将动词、形容词和名词有机地统一起来进行关联,未来还应多考虑概念层面的研究,构建资源的技术标准和规范。最终围绕旅游资源展开“技术、资源、规范”研究,并基于北大团队的研究优势和特色,构建一个“旅游攻略问答系统”。
此次项目合作凸显了北大中文信息处理的研究特色,使语言资源与应用实现良好的衔接;系统目标紧扣“一带一路”政策规划,以提升应用价值。在整合相关理论和资源的基础上,构建面向特定领域的文本多层次、多维度的全息信息展示系统。
(北京大学中文系 寇鑫、王恩旭/供稿)







