开源数据集
为AI研究提供广泛的训练数据并快速改善模型性能
语音数据集

人工智能模型需要大量的数据来训练。对于缺乏数据采集和标注经验的人来说,获取优质的数据集会花费大量的时间。开源数据则能帮助解决这些困难,为AI研究提供助力。

中文手机朗读数据库

MagicData中文手机录音音频语料库包含755小时的中文普通话朗读语音数据,其中分为训练集712.09小时、开发集14.84小时和测试集28.08小时。本语料库的录制文本覆盖多样化的使用场景,包括互动问答、音乐搜索、口语短信信息、家居命令控制等。采集方式为手机录音,涵盖多种类型的安卓手机;录音输出为PCM格式。1000名来自中国不同口音区域的发言人参与采集。MagicData中文手机录音音频语料库由MagicData有限公司开发,免费发布供非商业使用。

Data Specification
日语手机朗读数据库

MagicData拥有1500小时日语语料库,本次开源30小时数据集作为测试集。本语料库的录制文本为日常用语。采集方式为手机录音;录音输出为PCM格式。37名来自日本不同区域(如东京、大阪、北海道等)的发言人参与采集。MagicData日语手机朗读数据库(30小时)由MagicData有限公司开发,免费发布供非商业使用。 爱数智慧研发制作了朗读、面对面对话、电话对话等多场景下的中文、英文、日语、韩语等数十种语言的语音数据库。该数据库得到了行业的广泛认可。如您想了解更多爱数数据库信息,欢迎您联系我们。

Data Specification
Show More
>
销售部
购买数据集或者获取数据采集/标注服务评估报价,请填写此表单。
姓名
*
公司名称
*
邮箱地址
*
电话
*
详情
国家
城市
提交
资源部
如果您想成为爱数智慧的数据采集和标注团队,请填写此表单。
承接数据采集项目
语种*
地区*
承接数据标注项目
语种*
联系信息
姓名*
公司名称*
邮箱地址*
电话*
项目案例*
地址*
提交
市场部
如果您想转载爱数智慧的文章或者告知我们展会信息,请填写此表单。
姓名
*
公司名称
*
邮箱地址
*
电话
*
详情
提交
人力资源部
如果您想要加入爱数智慧,成为团队的一员,请填写此表单。
姓名
*
邮箱地址
*
电话
*
职位
*
上传简历
提交
样例下载
姓名*
邮箱*
电话*
公司名称*
职位
部门
公司产品
我还对以下数据感兴趣
语种:
风格
场景

我们会进行电话回访,确认信息后将提供数据集下载方式。
提交
提交成功
我们的工作人员将尽快与您联系。
页面将在3秒后自动关闭
>
TOP