欢迎来到北京海天瑞声科技股份有限公司-海天瑞声      联系电话:010-62660053  电子邮件:contact@speechocean.com

English

新闻资讯>详情

语音识别、语音合成技术基础数据关键之:发音词典


在刚刚落幕的ICASSP2016上,北京海天瑞声科技有限公司展示了其在多语种发音词典方面的成果。


北京海天瑞声科技有限公司是一家全球领先的、多语言、跨领域的人工智能数据资源及相关数据服务的提供商。自1998年成立以来,海天瑞声已经为150多家全球知名企业和研究机构,提供了覆盖75个国家和地区、110多种语言的语音数据资源和科研服务,并拥有超过500个可授权使用的大规模数据库资源产品,以及300多个科研数据资源,覆盖语音合成语音识别机器翻译网络搜索自然语言理解图像识别等人机交互技术领域。尤其是在语音数据采集语音数据转写图像标注等方面。


据“海天瑞声”的首席科学家、研究中心总监郝玉峰博士介绍,“海天瑞声”是国内唯一一家有能力制作多语种发音词典数据供应商。截止目前,针对语音识别与合成研究与应用,海天瑞声能够提供近60个语言和地区的发音词典,可授权词条达400多万,不但包括业内较为罕见的阿拉伯语、希伯来语、乌尔都语等语言词典,部分词典还包括词性标注词频标注领域标注等标注信息。同时,考虑到语音语言应用研究的发展与标准化,“海天瑞声”还大力推进X-SAMPA方案设计多语种音素集,目前30%以上的发音词典支持此方案。而且,“海天瑞声”具有优秀的语言学家团队,可以为用户给出专业化的语言语音方面顾问服务。


郝玉峰博士介绍


郝玉峰,2004年毕业于东南大学,获工学博士学位,在人工智能技术与语言学方面具有丰富的研发经验。2008年加入海天瑞声,任研发中心总监兼首席科学家,负责公司技术战略方向规划、技术创新和研发管理。在他的领导下,研发中心设计出大量优秀软件,极大地提高了工作效率;研发出 大量的语音与语言资源数据库,满足了众多高科技企业与科研院所研究与产品化的数据需求;跟进前沿技术发展,提出语言资源、模型训练、数据评测、咨询服务一体化技术解决方案,为研发与产品化解决后顾之忧。同时,已在国内外期刊和会议上发表论文20余篇。目前,还担任中国人民大学计算机系工程硕士导师、中国中文信息学会语音信息专业委员会委员。


更新时间:2016-04-11

相关文章