中文普通话车载识别语料库由天籁数据中心的项目组在中国大陆采集完成,属于SpeechOcean的多语种车载识别语音项目之一,产品编号是King-ASR-122。
该库共计包含100人的母语为中文普通话的发音人的语音文件(50名男性,50名女性),所有发音人在年龄(主要在 18 – 30(62人),31– 45(28人),46 – 60(10人))、性别(男50% 女50%)和口音区(北方60%,吴10%,湘5%,赣5%,客家5%,闽5%,粤10%)均进行了平衡;所有文本语料考虑到识别引擎在不同方面的训练和测试需要都进行了特殊的平衡设计,涵盖了车载识别技术应用相关的15个大类35个子类别(详细资料见技术文档);每位发音人都覆盖了待车、城市驾驶和高速公路驾驶三种录音环境中的至少两种环境,每人在每种录音环境下分别录制160个条目,合计320个条目,并在空调开启/关闭、窗口开/关、音响设备等不同噪音场景方面进行了均衡覆盖。
该库采用在中国大陆地区比较流行的车型Mazda Wagen以及Mazda six进行采集,采用4个高质量通道录制(C1: SHURE SM10A, C2: SENNHEISER ME104, F1: AKG Q400, F2: AKG Q400)所有通道均按照特殊设计的位置在车内进行科学合理的布置。
每个语音条目均以一个独立的文件的方式存储并且每个文件都伴有一个ASCII SAM标记文件记录相应的数据信息。该库同时也含有一个基于SAMPA标准的发音词典,并且所有数据都进行了人工转写与标注处理。
该产品详细资料及产品样例,请点击King-ASR-122。
产品动态
