语音数据集
人工智能模型需要大量的数据来训练。对于缺乏数据采集和标注经验的人来说,获取优质的数据集会花费大量的时间。开源数据则能帮助解决这些困难,为AI研究提供助力。
语音数据集
中文手机朗读数据库

MagicData中文手机录音音频语料库包含755小时的中文普通话朗读语音数据,其中分为训练集712.09小时、开发集14.84小时和测试集28.08小时。本语料库的录制文本覆盖多样化的使用场景,包括互动问答、音乐搜索、口语短信信息、家居命令控制等。采集方式为手机录音,涵盖多种类型的安卓手机;录音输出为PCM格式。1000名来自中国不同口音区域的发言人参与采集。MagicData中文手机录音音频语料库由MagicData有限公司开发,免费发布供非商业使用。

Data Specification
语种 : 中文
录音环境 : 安静室内
有效时长 : 755小时
录音语料 : 日常口语句子
说话人介绍 : 1000名来自中国不同口音区域的发音人参与采集
PCM : PCM
录音设备 : 智能手机
适用领域 : 语音识别
数据敏感项 :
版权所有者 : 爱数智慧
Sample Download
This work is licensed under the Creative Commons Attribution-Noncommercial-Prohibited Acting 4.0 International License Agreement.
Usage Instructions

使用人在浏览本网站并对数据进行使用时应遵守下列规定:

  1. 使用人在下列情况下使用数据,不支付报酬,但应当附上 “数据引用于Magic Data Co., Ltd., www.magicdatatech.cn/,并且不得侵犯本公司对该数据所拥有的其他权利。 (1)为个人学习、研究而使用数据; (2)为介绍、评论某一作品或者说明某一问题,适当使用本数据; (3)为报道时事新闻,在报纸、期刊、广播电台、电视台等媒体中不可避免地引用该数据; (4)为学校课堂教学或者科学研究,使用该数据供教学或者科研人员使用; (5)国家机关为执行公务在合理范围内使用已经发表的作品;

  2. 在使用被许可使用的数据时,使用方不得用作商业目的,使用方不拥有销售、转让、出版等的权利;

  3. 使用方应将该数据作为整体使用,未经许可不得对数据内容进行修改,不得对数据格式进行转换或者进行二次开发。

  4. 本公司不承诺对所提供的数据中可能存在的与现势的某种不一致或者缺陷进行修改。本公司不因该数据本身的瑕疵而对使用方所造成的任何后果承担任何责任。

  5. 使用人若有超出上述使用限制的行为,本公司一经发现,将采取法律手段追究侵权人的责任。

销售部
购买数据集或者获取数据采集/标注服务评估报价,请填写此表单。
姓名
*
公司名称
*
邮箱地址
*
电话
*
详情
国家
城市
提交
资源部
如果您想成为爱数智慧的数据采集和标注团队,请填写此表单。
承接数据采集项目
语种*
地区*
承接数据标注项目
语种*
联系信息
姓名*
公司名称*
邮箱地址*
电话*
项目案例*
地址*
提交
市场部
如果您想转载爱数智慧的文章或者告知我们展会信息,请填写此表单。
姓名
*
公司名称
*
邮箱地址
*
电话
*
详情
提交
人力资源部
如果您想要加入爱数智慧,成为团队的一员,请填写此表单。
姓名
*
邮箱地址
*
电话
*
职位
*
上传简历
提交
样例下载
姓名*
邮箱*
电话*
公司名称*
职位
部门
公司产品
我还对以下数据感兴趣
语种:
风格
场景

我们会进行电话回访,确认信息后将提供数据集下载方式。
提交
提交成功
我们的工作人员将尽快与您联系。
页面将在3秒后自动关闭
>
TOP