欢迎来到北京海天瑞声科技股份有限公司-海天瑞声      联系电话:010-62660053  电子邮件:contact@speechocean.com

English

新闻资讯>详情

儿童录制语音数据汇总

 

电子产品不仅在成人世界扮演着不可或缺的角色,越来越多的儿童也开始接触如智能教育软件、智能游戏机、陪伴型机器人、儿童智能手表等高科技产品。在市场上,大多数的语音识别系统都是为成年人而服务。但其实儿童在音色、措辞、速度和说话习惯等方面和成年人有着明显的区别,所以普通的语音识别系统往往无法完美适用于儿童。


海天瑞声所录制的儿童语音识别数据共计3000小时,由4000多位儿童参与录制,覆盖了十几种语言,包括中文、英语、西班牙语、法语等大语种,也包含一些小语种,如泰语、印尼语、马来语等。


此外,我们还有一个中文童声合成数据库,由一位7岁的女孩录制,共计1.15小时。


语音识别数据库详情如下:

相比于成人语音,儿童语音无论是在录制过程中还是后期处理中都要相对复杂一些。在挑选发音人时,我们会选用发音清晰、表达能力强的母语发音人来录制,并且也均衡了儿童的性别和地区分布等因素。

 

我们充分考虑到了儿童语音识别应用最多的场景,所以录音所用到的文本语料主要是从故事书、学校课本等领域选取。

 

在后期处理中,所有语料都由我们专业团队进行严格的人工校对、筛选过滤和质检,并由母语发音人做了转写和标注,整体准确率不低于95%。此外,我们为每一个语音库配备相应的发音词典。


如果您需要以上数据或需要数据订制服务,可以通过以下方式联系我们:


网站链接:http://kingline.speechocean.com

电话咨询:010-62660053

邮件咨询:contact@speechocean.com


更新时间:2018-08-07

相关文章