欢迎来到北京海天瑞声科技股份有限公司-海天瑞声      联系电话:010-62660053  电子邮件:contact@speechocean.com

中文 | English

新闻资讯>详情

东亚国家语音识别(ASR)数据库汇总

 

东亚作为世界五大文明发源地之一,在长期的历史发展过程中,各国都形成了具有本国特色的语言。在斯坦福大学、加州大学洛杉矶分校等世界名校中,都开设有“东亚语言文化”这一课程。

目前,海天瑞声共有东亚国家(中、日、韩、朝)语音识别数据库181个,涵盖10万多位发音人与9万小时语音时长的数据。

耳语数据库

现有3.3小时的中文耳语语音库,由21位发音人,录制3千句语料。

中文方言库

有3种方言库,包含四川话、上海话和闽南语,共有大约5千小时数据,由3千位发音人录制。每个库分别配备一个专业发音词典。

少数民族语音库

维吾尔语库6个,含1700小时语料;藏语库4个,含600小时语料。分别配备一个包含10万词条的发音词典。

噪音环境

现有2万小时的中文数据、1千小时的日语数据和340小时的韩语数据是在噪音环境中录制的,如街道、餐厅、车站等公众场所。

智能家居(智能音箱、电视、空调等)

我们现有450小时应用于智能家居(包括智能音箱、电视、空调等)的中文语音库。

儿童语音识别应用

大约530小时的中文语音数据,由4-11岁的儿童录制,可应用于儿童语音识别场景。

车载应用

我们现有大约2千小时的车载语音库,包括中文、韩语和日语。

自由对话语音库

现有2万多小时的对话数据,其中2万小时中文,2千小时日语,1千小时韩语和1千小时朝鲜语。

 自由发挥语音库(spontaneous speech) 

即录音人自己在录音设备前根据特定的话题自由发挥,我们现有3个自由发挥语音库,由1500位发音人录制了6千小时语料。

稀有语种语音库

北朝鲜语自由对话识别库,含1千名发音人,大约1千小时录音时长,并有一个10万词条的北朝鲜语发音词典,该库由母语发音人标注、转写。据我们所知,这是目前仅有的一个能用于产业化研发需求的北朝鲜语音库。

如果想了解更详细的信息,请点击“阅读原文”访问我们的网站。

 
移除
点击此处添加图片说明文字

所有进行录音的发音人全部经过专业的语言学家测试,需要其发音标准,并且语言表达能力强,发音吐字清晰。在发音人的年龄、性别和地区分布等方面我们也做了均衡考虑。

对于所有的非对话库——其文本都是在语言学家研究了该国语言的语音学现象的基础上精心设计而成,并且让发音人以最自然的方式按照设计好的文本来进行录音。

对于所有的对话库——发音人按照挑选好或者自行挑选的主题进行自由对话,在录音过程中我们不对发音人和交谈节奏做任何人为引导,以确保对话的自然性。

在后期处理中,所有语料都由我们专业团队进行严格的人工校对、筛选过滤和质检,并由母语发音人做了转写和标注,整体准确率不低于95%。同时,我们为每一个数据库配备一个专业发音词典。


如需了解更多的数据信息,可以通过以下方式联系我们:

网站链接:http://kingline.speechocean.com

电话咨询:010-62660053

邮件咨询:contact@speechocean.com

更新时间:2018-03-27

相关文章