数据采集服务

采集服务优势

全球优质采集资源

近20年累计全球优质资源,支持不同人种、190种语言、文字、物体、场景信息及近百个国家的本地化项目实施。

行业场景:采集资源及能力覆盖全球近百个国家的数十个细分行业,包含智能驾驶、智慧医疗、智慧城市、智能家居、智慧金融、智慧教育、智能应用、智能硬件等。

业务线:专业硬件设备支持,例如应用于计算机视觉领域的深度相机、红外相机、毫米波雷达、Xsens手套组合、人体3D扫描仪等,支持2D图像及视频,红外、深度图像,3D点云等多种数据类型的采集;应用于智能语音领域的麦克风阵列、录音笔、专业录音棚及工业级录音设备等,支持多种语言及细分场景音频数据采集;近百个国家语言语种的文本及OCR数据采集。

核心技术保障

全流程技术平台保障标准化采集管理与实施。

算法控制进行实时质检,从源头上做好数据质量把控。

百余项核心技术、专利和软著的支持,自主研发一体化数据处理平台,保证效率及质量。

权威资质认证

严格把控数据安全生产,确保数据安全性与合规性。

生产管理流程符合全球主流法规要求。

通过ISO/IEC27701,ISO/IEC 27001等权威资质认证,严格把控数据生产的每一个环节。

数据采集服务

采集服务能力

语音识别数据采集

通过手机、桌面、麦克风阵列、录音笔、电视等多种设备进行190种语言语种的采集,可在安静、公共场所、大型会议、车展、车载等指定背景环境进行采集。

 

中外方言采集

儿童语音采集

老人语音采集

多通道远场录音采集

多人会话采集

会议采集

车载语音采集

情感语音采集

声纹录音采集

歌曲录音采集

心肺音临床数据采集

动物叫声采集

语音合成数据采集

支持全球190种语言,专业发音人的语音合成数据录制,专业录音棚及工业级录音设备,保障数据质量。

 

方言数据录制

儿童声音录制

多种风格音色录制

平均音色录制

情感语音数据采集

有声书音色录制

主播音色录制

虚拟偶像音色录制

歌曲录制

文本采集

基于全球数十个行业领域从业人员资源储备,支持190种语言、专业背景下的语料采集及制作,例如医疗、金融等。

 

手语语料

金融QA语料采集

转账交易语料采集

医疗问答语料采集

医疗引导语料采集

生活服务语料采集

问答社区语料采集

评论打分语料采集

人机交互语料采集

社交媒体语料采集

学术领域语料采集

多语言平行语料采集

图像及视频采集

以全球各地场景、全球近百个国家语言手写体票据、不同肤色人种、通用物体、动植物、车辆交通等为对象的2D及3D图像、视频采集。

 

手语3D视觉数据采集

人脸表情采集

人体姿态采集

儿童图像采集

亲属人脸采集

运动场景采集

道路交通采集

通用物体采集

指关节操作采集

应用场景

智能驾驶

覆盖不同环境、城市、行驶道路情况的车辆、行人图像等数据采集,支持2D、3D不同采集方式 ;应用于DMS、OMS智能系统的驾驶员、乘客行为采集,以及不同车速、不同位置多通道语音数据采集。
 

智能家居

覆盖家居场景下语音、视觉交互数据采集,包含语音、声纹、情感语音、人脸、肢体动作、姿态等数据,应用于唤醒命令词控制、门禁人脸识别、声纹识别控制、智能冰箱、扫地机器人等场景。

运动生活

不同光线环境下,不同运动图像的采集,包括篮球、足球、hiphop、羽毛球等,用于智能教练、智能裁判等应用。

智能安防

公共场所例如商超、办公楼宇、施工场所、车站等安防视角下的行人行为采集,用于生物识别、行为监测等技术手段,广泛地应用于城市道路监控、车辆人流监测、公共安全防范等。

智慧城市

城市环境下智能楼宇、智能交通、自助公众设施等应用领域中的语音、图像、文本数据采集。

互联网应用

智能设备中的搜索引擎、语音交互、拍照特效、身份识别等智能应用需要的语音、文本关系、图像数据采集。
 

服务流程

需求评估

采集方案定制

试采集

质量确认

批量采集