欢迎来到北京海天瑞声科技有限公司-海天瑞声      联系电话:010-62660053  电子邮件:contact@speechocean.com

中文 | English

新闻资讯>详情

【免费数据库】哈萨克语语音识别数据库

哈萨克语语音识别数据库

数据库简介
           数据库名称:哈萨克语语音识别数据库
            数据编号:  King-ASR-M-007
            数据参数:  16k,16bit
            数据规模: 8.3 GB
            录音通道:  单通道
            录音平台:  手机+桌面
            录音时长:  56小时
            录音人数:  92人

数据用途:语音识别系统训练、测试、语音分析

语种介绍


哈萨克语--中亚小语种
哈萨克语,属阿尔泰语系中的突厥语族,是哈萨克斯坦的官方语言和全球哈萨克人所使用的语言,与其他属突厥语族的民族语言相当接近。
目前,使用哈萨克语的人口数量大约在3000万左右,分布在哈萨克、俄罗斯、乌兹别克和中国西北部等地区。

数据详情


稀有语音数据--海天瑞声独家推广
该数据库是清华大学、新疆大学、西北民族大学所承接的“国家自然科学基金委少数民族语音识别重点项目”开放数据库的一部分。总共录制了92位发音人的语音数据。
这个数据库包含两部分:训练语料和测试语料。训练语料数据库有86名发音人的声音数据,而测试语料数据库中,有6名发音人的声音数据。
文本中包含14400条语句,其中,12000条是训练语料,而2400条是测试语料。
所有的发音人都在安静环境中进行录音,语音文件也都经过了母语发音人的转写。

获取方式


该数据在天籁数据中心平台上的标价是200积分。欢迎大家用手中语音库或积分换取。

联系我们
网站链接:http://kingline.speechocean.com
电话咨询:010-62660053
邮件咨询:contact@speechocean.com

目前我公司手机网站已上线。如果您想了解我们目前可授权使用的工程化应用词典数据资源,请点击“阅读原文”。

更新时间:2017-04-24

相关文章