欢迎来到北京海天瑞声科技股份有限公司-海天瑞声      联系电话:010-62660053  电子邮件:contact@speechocean.com

中文 | English

新闻资讯>详情

【海天瑞声】亚洲语言资源汇总

 

亚洲历史悠久文化,是世界语言种类最多且最复杂的地区,拥有2000多个语种。除中国语言(普通话、粤语、方言、少数民族语言)之外,我公司现有亚洲语音识别数据库106个,共包含十几种语言,约3万5千名发音人,近4万小时,2千万句语料,及若干对话语料。

详情如下:

 
移除
点击此处添加图片说明文字

查看过往推送:

1.  中文普通话资源汇总

2.  粤语资源汇总

3.  中国方言系列:四川话上海话闽南话

4.  少数民族语言资源汇总


所有进行录音的发音人不仅经过专业的语言学家测试,并且要求他们是以所录语言为母语,这些发音人语言表达能力强,发音吐字清晰。在发音人的年龄、性别和地区分布等方面我们也做了均衡考虑。

对于所有的非对话库——其文本都是在语言学家研究了当地语言的语音学现象的基础上精心设计而成,并且让发音人以最自然的方式按照设计好的文本来进行录音。

对于所有的对话库——发音人按照挑选好或者自行挑选的主题进行自由对话,在录音过程中我们不对发音人和交谈节奏做任何人为引导,以确保对话的自然性。

在后期处理中,所有语料都由我们专业团队进行严格的人工校对、筛选过滤和质检,并由母语发音人做了转写和标注,整体准确率不低于95%。

另外,我们还有若干亚洲语种的语音合成数据库(TTS)及相关发音词典(Lexicon)。

注:部分数据库调整中,后期参数可能略有变化,具体信息请邮件或电话咨询。


联系我们:

网站链接:http://kingline.speechocean.com

电话咨询:010-62660053

邮件咨询:contact@speechocean.com

更新时间:2017-11-25

相关文章