欢迎来到北京海天瑞声科技股份有限公司-海天瑞声      联系电话:010-62660053  电子邮件:contact@speechocean.com

English

新闻资讯>详情

第三届“东方语种识别竞赛”结果揭晓

 

【导言】

东方语种识别竞赛(Oriental Language Recognition Challenge)是由清华大学语音和语言技术中心(CSLT)和海天瑞声(SpeechOcean)于 2016 年共同发起,其旨在加强相关领域研究者之间的技术交流、促进东方语种识别的技术发展。继前两届竞赛的成功举办,本年度竞赛(OLR 2018)共吸引了全球 25 支队伍的参与,并于 11 月 14 日在美国夏威夷举办的 2018 年亚太地区信号与信息处理峰会(APSIPA ASC 2018)上宣布了竞赛结果。


【竞赛简介】

相较于上一届竞赛,OLR 2018 仍包含了 10 种东方语言,包括汉语普通话、粤语、日语、韩语、俄语、越南语、印尼语、藏语、维吾尔语、哈萨克语,数据总量累计超过 120 小时。其中,3 种少数民族语言(藏语、维吾尔语和哈萨克语)是由清华大学、西北民族大学和新疆大学所共同承接的国家自然科学基金重点课题“多语言少数民族语音识别”项目(M2ASR)提供,另外 7 种语言由海天瑞声提供。不同于往届比赛,OLR 2018 设置的任务更具挑战性和实用性,共包含以下三个各有侧重的子任务(清华大学提供了各个任务的基准线代码,方便参赛者快速搭建系统):

1. 短语音语种识别:该任务所要识别的语音时长短至 1 秒。

2. 混淆语言语种识别:该任务所要识别的语音来自 3 种极易混淆的语言(普通话、粤语、韩语)。

3. 开集语种识别:该任务所要识别的语音可能属于非目标语言,用以干扰常规语种识别


【竞赛结果】

本届参赛的 25 支队伍中共有 17 支队伍提交了有效结果。其中,任务一的最佳识别结果由厦门大学的 xmuspeech 团队取得;任务二和任务三的最佳识别结果皆由网易公司的 NetEase AI-Speech 团队取得。此外,取得佳绩的队伍还包括来自杜克昆山大学-腾讯、澳大利亚新南威尔士大学、北京语言大学、因诺微公司、香港中文大学等团队。

以下是三个子任务中前 10 名的竞赛结果。


任务一:短语音语种识别

点击此处添加图片说明文字


任务二:混淆语言语种识别

点击此处添加图片说明文字


任务三:开集语种识别

点击此处添加图片说明文字


【研讨会】

为进一步促进各参赛队伍的技术分享与交流,清华大学语音和语言技术中心将于近期举办一场关于多语言语音处理技术的研讨会,届时一同举办 OLR 2018 竞赛的颁奖活动,敬请关注。


【更多信息】

本次竞赛得到了智能管家(ROOBO)的赞助支持。更多信息请浏览竞赛官方网站 http://olr.cslt.org。


更新时间:2018-12-04

相关文章