欢迎来到北京海天瑞声科技股份有限公司-海天瑞声      联系电话:010-62660053  电子邮件:contact@speechocean.com

English

新闻资讯>详情

泰语单句语音识别数据库

数据名称:泰语单句语音识别数据库数据编号:King-ASR-226数据制作:海天瑞声数据参数:16k, 16bit录音通道:3通道录音时长:3099小时录音平台:手机数据用途:语音识别系统训练、测试、语音分析

数据简介

泰语,旧称暹罗语,是泰国的官方语言。全球有约6800万人口使用泰语,主要是分布在泰国、老挝、缅甸、越南西北、柬埔寨西北、中国西南、印度东北等地。

该泰语语音识别数据库是我公司于今年6月在泰国采集完成,共有806位本地发音人参与了录音,其中男女性别比例约为1:1。发音人主要来自于以泰语为主要官方语言的地区。本库包含超过150万条语音数据,纯语音时长为3099小时(包含首尾静音段),数据库的总规模为332 GB。

在设计此语音库的文本语料时,我们充分考虑到了语音识别研究中模型训练和测试的需要,主要是从新闻、日常交流、网站中选取,在安静的办公室录音环境下完成。

语音数据库还包含一个发音词典

发音人年龄分布情况

更多关于此数据库的细节,请电话或邮件咨询我们。

我们将会不定期推送免费数据包,请关注我们的微信公众号,不要错过推送哦!

网站链接:http://kingline.speechocean.com

电话咨询:010-62660053

邮件咨询:contact@speechocean.com


更新时间:2016-11-29

相关文章