开源数据集

Provide extensive training data for AI research and improve model performance quickly

中文手机朗读数据库

中文,朗读,安静室内,智能手机

MagicData中文手机录音音频语料库包含755小时的中文普通话朗读语音数据,其中分为训练集712.09小时、开发集14.84小时和测试集28.08小时。本语料库的录制文本覆盖多样化的使用场景,包括互动问答、音乐搜索、口语短信信息、家居命令控制等。采集方式为手机录音,涵盖多种类型的安卓手机;录音输出为PCM格式。1000名来自中国不同口音区域的发言人参与采集。MagicData中文手机录音音频语料库由MagicData有限公司开发,免费发布供非商业使用。

数据详情

语种

中文

录音环境

安静室内

有效时长

755 小时

录音语料

日常口语句子

说话人介绍

1000名来自中国不同口音区域的发音人参与采集

文件格式

PCM

录音设备

智能手机

适用领域

语音识别

数据敏感项

版权所有者

爱数智慧

样例下载

本作品采用知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议进行许可。

Usage Instructions
使用人在浏览本网站并对数据进行使用时应遵守下列规定:
1. 使用人在下列情况下使用数据,不支付报酬,但应当附上 “数据引用于Magic Data Co., Ltd., “www.imagicdatatech.com/index.php/home/dataopensource/data_info/id/101”, 05/2019”,并且不得侵犯本公司对该数据所拥有的其他权利。
(1)为个人学习、研究而使用数据;
(2)为介绍、评论某一作品或者说明某一问题,适当使用本数据;
(3)为报道时事新闻,在报纸、期刊、广播电台、电视台等媒体中不可避免地引用该数据;
(4)为学校课堂教学或者科学研究,使用该数据供教学或者科研人员使用;
(5)国家机关为执行公务在合理范围内使用已经发表的作品;
 
2. 在使用被许可使用的数据时,使用方不得用作商业目的,使用方不拥有销售、转让、出版等的权利;
3. 使用方应将该数据作为整体使用,未经许可不得对数据内容进行修改,不得对数据格式进行转换或者进行二次开发。
4. 本公司不承诺对所提供的数据中可能存在的与现势的某种不一致或者缺陷进行修改。本公司不因该数据本身的瑕疵而对使用方所造成的任何后果承担任何责任。
5. 使用人若有超出上述使用限制的行为,本公司一经发现,将采取法律手段追究侵权人的责任。
 

联系信息

姓名 *
电话 *
邮箱 *
公司名称 *
地址 *

我们会进行电话回访,确认信息后将提供数据集下载方式。