欢迎来到北京海天瑞声科技股份有限公司-海天瑞声      联系电话:010-62660053  电子邮件:contact@speechocean.com

English

新闻资讯>详情

清华大学和海天瑞声联合举办的AP16–OLR比赛发布结果

APSIPAASC 2016(Asia Pacific Signal and Information Processing Association)于2016年12月13日,在韩国的济州岛召开,这是亚太地区顶级的信号和信息处理学术会议。有三百多名来自亚太地区各国的语音处理、图像处理领域的专家、学者及研究人员出席了会议。

清华大学语音语言技术中心(CSLT)联合海天瑞声(SpeechOcean),在此次会议上发起了东方多语言信息处理(Oriental Multilingual Speech andLanguage Processing)的特殊议题,内容包括(但不限于)面向东方语言的语种识别、语音识别语音合成、说话人识别、语言理解等多语言语音和语言处理任务。同时,清华和海天瑞声还联合发布了一项“东方语种识别竞赛(AP16-OLRChallenge)”,由海天瑞声提供语音数据,清华大学提供基线系统,吸引了十数家研究机构和业界公司报名参与,最终有8支队伍提交了9个系统(NUS和I2R联合团队提交了两个系统)。

 
(竞赛组织者和会议主席李海洲老师合影)
移除
(竞赛组织者和会议主席李海洲老师合影)

清华大学的王东老师在会议上宣布了竞赛结果以及排名:

由李海洲老师带领的南洋国立大学和Institute for Infocomm Research (I²R) 联合团队提交的两个结果分获第一名和第二名。

由郭武老师带领的中国科技大学语音及语言信息处理国家工程实验室团队提交的结果获得了第三名(机构第二名)。

 
(清华大学的王东老师在会议上宣布了竞赛结果)
移除
(清华大学的王东老师在会议上宣布了竞赛结果)

尤其值得一提的是:中国科技大学郭武教授的团队,是在先期提交(prior submission)截止日期前唯一提交结果的团队;而南洋国立大学和(I²R)联合团队虽然只参加了延期提交(extended submission),但从下载竞赛数据(11月初)到提交结果仅用了40天,展现出强大的实力。

 
移除
点击此处添加图片说明文字

详细结果已经发布在竞赛官方网站:http://olr.cslt.org


关于竞赛数据库AP16-OL7和东方语种语言资源


东方语系被认为是非常多样且复杂的,包含了以Austroasiatic languages(如柬埔寨语、越南语等)、TaiKadailanguages(如泰语、老挝语等)、Hmong-Mien languages (如中国南部的方言)、Altaic languages(如韩语、日语等)、Indo-Europeanlanguages (如俄语)等多种多样的语系。经过历史上长期的民族交流和融合,特别是近一个世纪以来英语对东方各国本土语言的影响,东方语系形成了丰富多变的声学和语言学现象,吸引了语音和语言研究者的高度关注。近年来,有大量的研究围绕着东方语种展开,如比较语言学、演变语言学、第二语言习得、社会语言学等等。

但是,国际上现存的具有一定规模的东方语种语音数据库还十分稀缺。这次语种识别竞赛中,海天瑞声推出了包含7种东方语言的数据库(AP16-OL7)供参赛队伍免费使用。该数据库包括7种语言,录音时长71小时,全部语音数据和文本数据都经母语发音人的精标,每种语言都配有一个发音词典


AP16-OL7是目前已知唯一的、针对东方语言特别设计的语音数据库。参与竞赛的团队也对海天瑞声的数据质量给予了高度认可。

 
(海天瑞声的陈清在会议上介绍AP16-OL7数据库)
移除
(海天瑞声的陈清在会议上介绍AP16-OL7数据库)

海天瑞声市场总监陈清在会议上介绍了该数据库的录制情况和基本参数(如下图)。详情可见CSLT和海天瑞声合作的论文“AP16-OL7: A MultilingualDatabase for Oriental Languages and A Language Recognition Baseline”. link: http://wangd.cslt.org/public/pdf/ole.pdf

 
移除
点击此处添加图片说明文字

海天瑞声”目前拥有18种具有独立知识产权的东方语言语音数据库,总时长超过5万小时,其中,所有语种都有发音词典。

 
移除
点击此处添加图片说明文字

在这次会议上,“海天瑞声”还介绍了其多达110种语言的数据服务能力、现存以及在建的多种语音、文本和发音词典等数据资源,引起了与会者的广泛关注。同时,“海天瑞声”在稀有语种语音数据方面的积累(包括朝鲜语、希伯来语、加泰罗尼亚语、阿拉伯语、捷克语、波兰语等)也给与会专家们留下了深刻印象。


海天瑞声一直致力于为学术界提供高品质的免费数据资源,以支持人机交互和模式识别领域的学术研究的进步。由海天瑞声运营的“天籁数据中心”,旨在为科研机构和高校提供一个可以交换、共享和代销数据的平台,以从一定程度上解决科研数据短缺的问题.


长按下面二维码关注我们,不要错过免费数据信息的推送!

 
移除
点击此处添加图片说明文字


更新时间:2016-12-19

相关文章