新闻中心

首页 关于我们

新闻中心

热点 | AI产生意识的关键在于AI训练数据?!
发布时间:2022/06/17
返回列表

“AI训练数据”

好物数据集推荐,让您的AI学得更好、懂得更多

像这样的数据,在海天瑞声的“精品数据库”中有很多,广泛应用于智能家居、智能驾驶、教育科研、智能安防、智慧金融、智慧交通、IOT等等多场景,不信来瞧!!

 

King-ASR-461:中文普通话识别语音库-对话,录音时长1209小时,该识别数据在安静办公室/家居环境中完成录制,共有1248位发音人参与,包括593位男性和655位女性,录音内容覆盖运动、旅行、食物、电影等领域。

 

King-OCR-004:中文OCR数据库-多角度,包含50190张图片。中文菜单路牌图片数据库,每样物品按照不同角度拍摄多次,适用于不同角度的OCR模型训练。

 

King-Lexicon-072:印度马拉雅拉姆语发音词典,包含常用词、专有名词等,合计100000词条,准确率98%以上,是适用于语音识别、语音合成应用的高质量精品词典。

数据决定了AI模型学习的上限,数据的规模、质量,对模型的泛化能力、鲁棒性能等会带来直接的影响。

 

海天瑞声致力于通过好的AI训练数据服务助力AI企业加速算法训练,用数据唤醒AI算法的生命力,推动AI前沿项目的全球商业落地。作为专业的AI训练数据服务商,深耕行业近20年,打造了近千个高质量成品数据集。迄今为止,与全球近700家科技巨头、科研机构、AI新兴企业建立了深度合作关系,以专业、可靠、安全的数据服务,成功交付数千个定制项目,深得客户信赖;依托覆盖70多个国家、170+种语言及方言的优质资源,技术领先的算法研发团队,经验丰富的项目团队,全方位助力客户在AI领域的创新探索。

 

 

 

海天瑞声作为全球AI训练数据服务行业领军者、国内较早从事人工智能数据服务的公司,将继续深耕行业,赋能AI企业发展,加速AI应用开发与迭代!

 

关于我们

 

海天瑞声(股票代码:688787)成立于2005年,是一家专注于为AI算法训练提供数据产品及解决方案的服务商。产品及服务类型包含语音识别数据、语音合成数据、文本数据、图像数据等。数据服务涵盖从方案设计到采集、标注直至交付的全流程。

 

联系我们

 

网站链接:http://www.speechocean.com/

邮件咨询:contact@speechocean.com

 

contact@speechocean.com

分享到微信朋友圈

打开微信,点击底部的"发现"

使用“扫一扫”即可将网页分享至朋友圈。