值得借鉴-蒙古人的自然口语资料库
中国网2月25日讯 记者从国家民委获悉,历经7年的搜集录制和标注加工,我国已在内蒙古自治区呼和浩特市建成一个4000万词级的蒙古语自然口语语料库。据悉,这一时长达3826小时的蒙古语自然口语语料库由档案文件、检索界面和资源系统组成。资源库可检索、可视听、可复制。
记者了解到,内蒙古自治区从2006年起投巨资实施该工程。这项工程是以搜集自然口语语料、收集书面语朗读语料、汇集现代文献语料和历史文献语料为对象,以收集、保护、保存、研究、利用蒙古语、达斡尔语、鄂温克语、鄂伦春语语言材料为目的的民族文化建设项目。
建成后的“蒙古语语料库建设工程”将为抢救濒危民族语言、保护弱势语言、保存并开发利用蒙古语等少数民族语言资源提供坚实基础,并为蒙古语等少数民族语言(文字)的规范化、信息化提供一个理想的信息资源。
反观,我们尚未形成官方的大环境支持,还需要长久的努力啊。蒙古语资料库已经涵盖了鄂伦春鄂温克等通古斯语族的语音资料,我们的官方连古籍的数字化都慢吞吞的。故意的吧。
页:
[1]