1万+小时东南亚多语种数据汇总
东南亚地处大洋洲、太平洋与印度洋之间,共由11个国家组成,总人口超6亿。近些年因其地理位置便利、物产丰富,以及自然风景优美,部分东南亚国家的经济得到了快速发展,也正因此,更多的AI场景在东南亚落地,带动了对东南亚语种数据的需求。
海天瑞声经过多年的积累,在小语种的采集和标注服务上有着非常丰富的经验。并一贯秉承对客户负责的态度,从了解需求到交付数据,层层把关,严格质检。
除了提供一站式的解决方案,我们还有相当规模的东南亚语种现有数据库,可直接授权使用。
部分数据库信息:
语音识别数据 | ||
语种 | 总录音人数 | 总录音时长(小时) |
泰语 | 1,216 | 3,463 |
印尼语 | 1,069 | 2,800 |
马来语 | 1,726 | 2,075 |
越南语 | 1,070 | 1,264 |
巴基斯坦乌尔都语 | 583 | 1,148 |
菲律宾他加禄语 | 257 | 507 |
新加坡人讲英语 | 404 | 710 |
菲律宾人讲英语 | 207 | 326 |
菲律宾裔美国人讲英语 | 100 | 172 |
越南裔美国人讲英语 | 100 | 194 |
巴基斯坦裔美国人讲英语 | 100 | 199 |
发音词典 | |
语种 | 词条数 |
越南语 | 104,088 |
马来语 | 101,935 |
巴基斯坦乌尔都语 | 101,211 |
如果您对以上数据库或对我们的一站式数据服务感兴趣,欢迎来电来函咨询,联系方式请见下方。
电话咨询:010-62660053
邮件咨询:contact@speechocean.com