企业资讯-海天瑞声

热点 | AI产生意识的关键在于AI训练数据？！

发布时间：2022/06/17

返回列表

“AI训练数据”！

好物数据集推荐，让您的AI学得更好、懂得更多

像这样的数据，在海天瑞声的“精品数据库”中有很多，广泛应用于智能家居、智能驾驶、教育科研、智能安防、智慧金融、智慧交通、IOT等等多场景，不信来瞧！！

King-ASR-461：中文普通话识别语音库-对话，录音时长1209小时，该识别数据在安静办公室/家居环境中完成录制，共有1248位发音人参与，包括593位男性和655位女性，录音内容覆盖运动、旅行、食物、电影等领域。

King-OCR-004：中文OCR数据库-多角度，包含50190张图片。中文菜单路牌图片数据库，每样物品按照不同角度拍摄多次，适用于不同角度的OCR模型训练。

King-Lexicon-072：印度马拉雅拉姆语发音词典，包含常用词、专有名词等，合计100000词条，准确率98%以上，是适用于语音识别、语音合成应用的高质量精品词典。

数据决定了AI模型学习的上限，数据的规模、质量，对模型的泛化能力、鲁棒性能等会带来直接的影响。

海天瑞声致力于通过好的AI训练数据服务助力AI企业加速算法训练，用数据唤醒AI算法的生命力，推动AI前沿项目的全球商业落地。作为专业的AI训练数据服务商，深耕行业近20年，打造了近千个高质量成品数据集。迄今为止，与全球近700家科技巨头、科研机构、AI新兴企业建立了深度合作关系，以专业、可靠、安全的数据服务，成功交付数千个定制项目，深得客户信赖；依托覆盖70多个国家、170+种语言及方言的优质资源，技术领先的算法研发团队，经验丰富的项目团队，全方位助力客户在AI领域的创新探索。

海天瑞声作为全球AI训练数据服务行业领军者、国内较早从事人工智能数据服务的公司，将继续深耕行业，赋能AI企业发展，加速AI应用开发与迭代！

关于我们

海天瑞声（股票代码：688787）成立于2005年，是一家专注于为AI算法训练提供数据产品及解决方案的服务商。产品及服务类型包含语音识别数据、语音合成数据、文本数据、图像数据等。数据服务涵盖从方案设计到采集、标注直至交付的全流程。

联系我们

网站链接：http://www.speechocean.com/

邮件咨询：contact@speechocean.com

上一篇：海天瑞声：助力AI企业出海，破解小语种密码下一篇：海天瑞声：做“AI+教育”的助跑者