| 编号 |
| King-ASR-118 |
|
| 名称 |
| 中文普通话识别语音库----(手机)-1200人 |
|
| 制作者 |
| 北京海天瑞声科技有限公司 |
|
| 语言 |
| 中文普通话 |
|
| 类型 |
| 语音识别 |
|
| 信道 |
| 手机电话 |
|
| 环境 |
| 办公室,噪音(餐厅),噪音(室外) |
|
| 参数 |
| 采样率:16K,16bit;录音通道:单通道;纯录音时长:329.360小时;磁盘容量:35.3 G。 |
|
| 标注 |
| 每个录音文件在对应session文本中进行了人工转写与标注处理。 |
|
| 资源用途 |
| 识别语音模型训练和测试等 |
|
中文普通话手机识别语料库由天籁数据中心的项目组在中国大陆采集完成,该库共计包含1200人的母语为中文普通话的发音人的语音文件(600名男性,600名女性),所有发音人在年龄(主要在 18 – 35(776人),36 – 45(296人),46 – 60(128人))、性别(男50% 女50%)和口音区(北方39%,吴14%,湘10%,赣5%,客家5%,闽11%,粤16%)均进行了平衡;所有文本语料考虑到识别引擎在不同方面的训练和测试需要都进行了特殊的平衡设计,涵盖了手机识别技术应用相关的14个大类47个子类别(详细资料见技术文档);每位发音人都覆盖了室内安静(办公室/家庭)和噪音(街道/餐厅/公交汽车/公园等)两种环境,每人在每种录音环境下分别录制150个条目,合计300个条目。
该库采用在中国大陆地区比较流行的手机操作系统进行采集,如Iphone、windows-mobile 6.X、Symbian及Android。语音数据的采样率为16 kHz, 16 bit, 所有声音文件均以未压缩文件形式存储。
每个录音文件在对应session文本中进行了人工转写与标注处理。