english english chinese chinese
Bookmark and Share
您的位置:首页 > 合作 > 数据合作平台

数据合作平台(DDC)

1、数据合作平台的目的?
2、数据提供者的利益?
3、发布类型?
4、知识产权保护?
5、如何向天籁数据中心提供数据资源?
6、其他综合信息查询?

-----------------------------------------------------------------------------------------------------------------------------------------------


1. 数据资源合作平台的目的?

        数据资源代理合作平台由北京海天瑞声科技公司的天籁数据中心搭建和运营,其宗旨是通过数据资源共享、交换和代理销售等方式为各研究机构和科研人员提供更加快捷的数据获取渠道和更多的数据资源,促进人机交互技术(HCI)和语言学习的研究以及新型智能技术的开发与应用。
        任何有助于人工智能技术研究和开发的训练和测试数据库资源均可通过该平台进行交流和推广,数据种类包括但不限于多语种语音合成语音数据、多语种语音识别语音数据、用于机器翻译的多语种平行语料库、生物特征数据库、图形图像数据库、音视频数据库、各种文本语料库等等。所有在该平台进行交流和展示的数据资源和数据资源提供者均按照《中华人民共和国民法通则》的规定受到严格保护。


2. 数据提供者的利益?

        天籁数据中心的工作人员充分理解研究人员和数据提供者彼此之间的需要,通过建立数据库代理合作平台使数据提供者至少在以下两个方面能够受益: 
        1)天籁数据中心与世界各地的众多科研院所和企事业单位建立了长期深入的合作关系,通过此数据代理合作平台,数据提供者不仅可以从数据的使用者获得使用许可收益而且也可以通过该平台展示的数据体现其相应的技术产品,从而帮助数据提供者在技术领域扩大知名度。在数据代理的情况下,您可以通过inquiry@speechocean.com将您希望被代理的数据样例及数据的具体说明以及相应的要求发给我们,我们将根据提供者的数据和具体需求进行评估并在3-5个工作日内反馈,如评估合格后我们将与您签署《数据代理协议书》。 
        2)天籁数据中心拥有丰富的数据资源,数据提供者还可以通过该平台与天籁数据中心以共享、交换数据或代理等方式获得其研究所需要的数据资源。详情请通过电子邮件inquiry@speechocean.com联系我们,并附带上您的数据和具体信息和需求情况,天籁数据中心将根据提供者的数据和具体需求进行评估并在3-5个工作日内反馈,如评估合格后我们将与您签署《数据共享/交换协议书》,并将提供您所欲共享或交换的数据库。


3. 发布类型?

        为了满足不同数据提供者的需要,天籁数据中心提供三种发布类型可供选择: 
        a) 数据的代理销售:数据提供者的数据库信息将发布在天籁数据中心的产品目录上,天籁数据中心以产品代理人身份根据数据代理合同的有关规定进行数据的销售。 
        b) 数据共享和捐赠:数据提供者以共享或捐赠方式将数据的各项权利授权给天籁数据中心,作为交换,数据提供者可以随时自由使用会员区相当于所提供数据三倍的数据资源,该数据资源仅限提供者单独使用但不得将从此类数据资源对外销售或泄漏给任何第三方。天籁数据中心有权将提供者提供的数据授权给其会员或非会员使用而不用向提供方支付任何费用。 
        c) 数据交换:通过数据库交换,数据提供者可以从天籁数据中心所有产品目录中获得其感兴趣的数据,该数据资源仅限提供者单独使用但不得将此类数据资源对外销售或泄漏给任何第三方。天籁数据中心有权将被交换的数据授权给其会员或非会员使用而不用向提供方支付任何费用。


4. 知识产权保护?

        天籁数据中心将依照《中华人民共和国知识产权法》给予数据提供者充分并合理的权益保障,有关协议如下:?
              →     数据分销协议;
              →     数据共享协议;
              →     数据交换协议。
        对于任何其他法律保护的问题,请联系inquiry@speechocean.com


5. 如何向天籁数据中心提供数据资源?

        天籁数据中心愿意与所有的科研机构、科研人员、企事业单位在数据资源建设方面建立友好的合作。为了使您的数据的成功推出,请确保您所提交的数据符合下列条件: 
        ♦       所提供的数据必须满足某种科研需要即有用性;
        ♦       数据提供者必须具备所提供数据库的完全自主知识产权,能够独立与天籁数据中心签署数据库的有关协议;
        ♦       所提供的数据资源必须附带有完整的数据库信息和相关质量标准文件,并使用户能很好地理解数据及其用途;
        ♦       提供售后服务的联系信息,使最终用户在使用中若发现问题,可以获得及时的沟通和解决方案。
        如您的数据资源满足以上条款,请发送邮件到release@speechocean.com 并附带一下信息资料:
        ♦      数据资源的基本信息包括数据库名称、提供者或合作者姓名或名称、该数据所在的项目名称(如有)、数据库的语言、类型(文本、语音、音视频等等)、数据库的大小(以K或MB表示;语音类数据请注明语音时长即小时数、文本数据请说明具体的字数或字节数)、文件格式,语音数据通道、数量和采样率,采样格式和其他描述语料库的参数,以及建议的使用用途。 
        ♦      数据库发布方式,关于代理人的数据请注明相关使用权限的费用,请注明所有相关数据库的权限使用费用,该费用可以根据天籁数据中心的评估进行进一步商讨。
        ♦       数据样例(由于我们的电子邮件大小的限制,如果样本数据过大,请分割成3 MB以下大小的文件分别传送给我们或通过我们的FTP上传)
        ♦      主要联络人(包括电子邮件和一对一的联络电话号码)
        一旦收到上述资料的申请,天籁数据中心的工作人员将在48小时之内给予反馈并与主要联络人讨论数据提交事宜的具体日程安排,包括数据及其具体技术文档提交日期、数据合同的签署日期、质量控制方法等等,同时天籁数据中心将具体数据上传的FTP也一并发给主要联络人。
        在收到的提供者的数据库后,天籁数据中心的工作人员将在三个工作日内完成所提供数据的评估工作,并将评估结果和具体发行日期反馈给数据提供者。
        通常天籁数据中心会将提供者提供的数据归档备份, 对于天籁数据中心所归档备份的数据资源,数据提供者可以 随时免费从天籁数据中心获得给数据的拷贝件。


6. 其他综合信息查询?

        如有其它需求,请发送邮件到inquiry@speechocean.com 天籁数据中心期待并欢迎与任何组织或个人合作,共同完善数据资源平台的建设。