首页 >> 语言学 >> 语言学术动态
“蒙古语语料库”建设取得重大成果
2014年11月06日 00:00 来源:内蒙古日报 作者:及庆玲 字号

内容摘要:蒙古语语料库”建设取得重大成果。

关键词:语料库;蒙古语;重大成果;语料;建设工程

作者简介:

  11月4日,清华大学计算机科学与技术系党委书记 、“蒙古语语料库”建设工程领导小组成员孙茂松教授在“蒙古语语料库”建设工程一期工程验收暨二期工程论证会上坚定地说:“‘蒙古语语料库’大规模搜集真实语言语料和限量收集珍贵文献语料,有利于国家语言资源安全,有利于民族语言资源保护,有利于民族语言文字信息化进程,有利于民族文化遗产保护。”

  会上,来自区内外的11位专家对“蒙古语语料库”一期工程取得的重大成果——“蒙古语言语语料库”的建立给予高度评价,认为该成果的取得功在当代、利在千秋。

  “蒙古语语料库”建设工程是2005年3月由自治区政府批准立项的内蒙古民族文化大区建设重点项目。工程分两期进行,计划用20年时间建成我国第一个2亿词级的蒙古语、达斡尔语、鄂温克语、鄂伦春语大型综合性语料库。

  工程实施10年来,课题组先后在我国八省区、蒙古国四省一市、俄罗斯布里亚特共和国和卡尔梅克共和国境内共97个采访点,搜集了6725人共计4200多小时的自然口语语料和4000多小时蒙古语新闻、故事和义务教育《语文》课本等书面语料,完成150个小时的自然口语语料国际音标标注和传统蒙古文撰写工作。目前,“蒙古语语料库”一期工程已形成了由档案文件、检索界面和资源系统三部分组成的数据库雏形,可向读者提供录音设备、发音人、采集点、文件名、谈话内容、方言词汇等与声音语料相关信息。

  “蒙古语语料库”二期工程预期目标是,最终建成一个2亿词级的包括8000万词言语语料库和1.2亿词文献语料库的蒙古语、达斡尔语、鄂温克语、鄂伦春语四种少数民族语言大型语料库及其数据库,并整合纳入“内蒙古民族文化建设研究数据库”。

分享到: 0 转载请注明来源:中国社会科学网 (责编:隋萌萌)
W020180116412817190956.jpg
用户昵称:  (您填写的昵称将出现在评论列表中)  匿名
 验证码 
所有评论仅代表网友意见
最新发表的评论0条,总共0 查看全部评论

回到频道首页
QQ图片20180105134100.jpg
jrtt.jpg
wxgzh.jpg
777.jpg
内文页广告3(手机版).jpg
中国社会科学院概况|中国社会科学杂志社简介|关于我们|法律顾问|广告服务|网站声明|联系我们