欢迎来到北京海天瑞声科技有限公司-海天瑞声      联系电话:010-62660053  电子邮件:contact@speechocean.com

中文 | English

新闻资讯>详情

新库首发!藏语对话+单句语音数据库

藏语是我国少数民族语言之一,使用者主要是藏族人,分布在西藏、青海等地。在全球,总共有超过六百万的藏语使用者。


由于在我国藏语的使用者大多分布在偏远且发展不均衡的地域,因此学习藏语、了解藏族文化和发展藏语语音技术在维护国家统一、保证民族关系融洽等方面起着巨大作用。

目前,少数民族语音数据库在国内并不常见,而对话库更是少之又少。海天瑞声将在近期推出一个全新的300小时藏语语音数据库,其中包含了200小时的自由对话语料以及100小时的单句语音语料。该库是在安静的办公室环境下,在电话信道和手机双平台同时录音。发音人主要来自于以藏语为主要官方语言的地区。

该数据库基本信息


对话语料:16bit, 8K, 单通道(电话信道),16bit, 16K, 单通道(手机)。200小时,6.54 GB,250位录音人,男女比例1:1,年龄分布均衡。


单句语料:16bit, 8K, 单通道(电话信道),16bit, 16K, 单通道(手机)。100小时,39.5 GB,250位录音人,男女比例1:1,年龄分布均衡。


在录制对话语料过程中,我们选择了人们在日常交流涉及最多的领域,包括家庭、工作、运动、购物、新闻、食物等21个最常见的话题。250位发音人两两一组,共有125组对话,每组对话大约讨论4个话题,在规定的话题条件下,讨论内容不设限制不做引导,即进行自由对话。


该数据库由藏语的母语使用者进行人工转写和标注,并经过了严格的质量检验。该语音数据库含有一个发音字典


更多关于此数据库的细节,请电话或邮件咨询我们。

我们将会不定期推送免费语音库,请关注我们的微信公众号,不要错过推送哦!


网站链接:http://kingline.speechocean.com

电话咨询:010-62660053

邮件咨询:contact@speechocean.com


更新时间:2017-01-05

相关文章