最新发布!查看 MagicData 成品数据集
行业解决方案
全部行业
智慧出行
智慧金融
智能社交
智能家居
智能终端
AI 数据解决方案
全部数据集
音频数据集
文本数据集
图片数据集
发音词典
MagicHub 开源社区
公司
新闻资讯
隐私政策
关于我们
English
没有找到想要的数据?
联系我们
数据集推荐
中文手机朗读数据库
MagicData中文手机录音音频语料库包含755小时的中文普通话朗读语音数据,其中分为训练集712.09小时、开发集14.84小时和测试集28.08小时。本语料库的录制文本覆盖多样化的使用场景,包括互动问答、音乐搜索、口语短信信息、家居命令控制等。采集方式为手机录音,涵盖多种类型的安卓手机;录音输出为PCM格式。1000名来自中国不同口音区域的发言人参与采集。MagicData中文手机录音音频语料库由MagicData有限公司开发,免费发布供非商业使用。
MDT-AE086 西班牙语朗读音频数据集
试听音频
MDT-AF068 郑州方言对话音频数据集
试听音频
MDT-RJ001 日语高质量口语式语音数据集
该数据集专为训练更懂口语表达的AI模型打造,有利于提升日语语音识别的自然交互能力,覆盖多场景真实对话,由多样化人群录制。精准标注音调核位置及促音、拨音等特殊音节,字准率高。通过合理标点还原日语独有的呼吸停顿节奏,助力模型理解口语中的省略句式与情感粒子,提升交互自然度。
MDT-AG039 河北唐山对话音频数据集
试听音频
MDT-BF011 天津话男声TTS数据集
【开源数据】
试听音频
Magic Data 数据优势有哪些?
合规性
符合ISO/IEC 27001和ISO/IEC 27701:2019标准认证
多维度
音频、文本、图像、音视频多模态数据
覆盖性
涵盖多领域的对话式、朗读式及自发式数据
高精度
人机协同高精度标注
Notice
×
TOP
联系我们