欢迎来到北京海天瑞声科技股份有限公司-海天瑞声      联系电话:010-62660053  电子邮件:contact@speechocean.com

中文 | English

新闻资讯>详情

【海天瑞声】中文普通话资源汇总

 

我公司现有中文普通话语音识别数据库70多个,另外还有语音合成库7个,以及1个发音词典。在目前已建成的数据库中:

1. 语音识别库共包含4万多名发音人,2万多小时,超过1千3百万句语料;

2. 语音合成库共包含7位发音人(6女1男),140小时,超过10万句语料;

3. 发音词典覆盖14万词条。


自从用了海天瑞声的语料库来训练识别引擎,哪怕你freestyle也能准确识别了呢……来看下产品库信息:

 
移除
点击此处添加图片说明文字

所有进行录音的发音人不仅全部经过专业的语言学家测试,并且需要普通话标准无口音,语言表达能力强,发音吐字清晰。在发音人的年龄、性别和地区分布等方面我们也做了均衡考虑。

对于所有的非对话库——其文本都是在语言学家研究了普通话的语音学现象的基础上精心设计而成,并且让发音人以最自然的方式按照设计好的文本来进行录音。

对于所有的对话库——发音人按照挑选好或者自行挑选的主题进行自由对话,在录音过程中我们不对发音人和交谈节奏做任何人为引导,以确保对话的自然性。

在后期处理中,所有语料都由我们专业团队进行严格的人工校对、筛选过滤和质检,并由母语发音人做了转写和标注,整体准确率不低于95%。

注:部分数据库调整中,后期参数可能略有变化,具体信息请邮件或电话咨询。

另外,King-ASR-216是我们的中文普通话明星产品库,备受行业巨头们的青睐,具体情况可以后台留言或者邮件电话咨询我们。

联系我们:

网站链接:http://kingline.speechocean.com

电话咨询:010-62660053

邮件咨询:contact@speechocean.com

更新时间:2017-11-25

相关文章