欢迎来到北京海天瑞声科技股份有限公司-海天瑞声      联系电话:010-62660053  电子邮件:contact@speechocean.com

English

新闻资讯>详情

俄语对话语音识别数据库

数据名称:俄语语音对话识别数据库-202人

数据编号:King-ASR-332

数据制作:海天瑞声

数据参数:16k, 16bit

录音通道:三通道

录音平台:手机

录音时长:300小时

数据用途:语音识别系统训练、测试、语音分析


数据简介

俄语(Russian)是俄罗斯的唯一官方语言,是哈萨克斯坦、白俄罗斯、吉尔吉斯斯坦官方语言之一。同时,俄语也是联合国六大官方语言之一,全球以俄语为母语的使用人数超过一亿四千万,当做第二语言使用的则有近四千五百万人。


为了提高语音识别引擎对俄语的识别准确度,我公司于今年年初录制了这个俄语自由对话语音识别数据库


该数据库是在俄罗斯采集完成的,在安静办公室环境下进行录音。共有202位本地发音人参与了录音,其中男女性别比例约为1:1。发音人主要来自于以俄语为主要官方语言的地区。


我们选择了人们在日常交流中涉及最多的领域,包括家庭、工作、运动、购物、新闻、食物、电影等30个最常见的话题。


发音人被分成两人一组,在可选的这些话题中自由挑选自己感兴趣的话题,并针对该话题进行自由对话。在录音过程中,对于话题的进展,我们不给予发音人任何暗示、控制和引导。


每组自由对话时间为1个小时,整个数据库的纯语音时长为300小时(包含首尾静音段),磁盘容量为35.8 GB。


该数据库由俄语的母语使用者进行人工转写和标注,并经过了严格的质量检验。该语音数据库还包含一个发音词典


发音人年龄分布情况发音人年龄分布情况

更多关于此数据库的细节,请电话或邮件咨询我们。


我们将会不定期推送免费数据包,请关注我们的微信公众号,不要错过推送哦!

网站链接:http://kingline.speechocean.com

电话咨询:010-62660053

邮件咨询:contact@speechocean.com


更新时间:2016-12-07

相关文章