最新发布!查看 MagicData 成品数据集
行业解决方案
全部行业
智慧出行
智慧金融
智能社交
智能家居
智能终端
AI 数据解决方案
全部数据集
音频数据集
文本数据集
图片数据集
发音词典
MagicHub 开源社区
公司
新闻资讯
隐私政策
关于我们
English
没有找到想要的数据?
联系我们
数据集推荐
MDT-AE025 泰国英语朗读音频数据集-唤醒词
试听音频
中文手机朗读数据库
MagicData中文手机录音音频语料库包含755小时的中文普通话朗读语音数据,其中分为训练集712.09小时、开发集14.84小时和测试集28.08小时。本语料库的录制文本覆盖多样化的使用场景,包括互动问答、音乐搜索、口语短信信息、家居命令控制等。采集方式为手机录音,涵盖多种类型的安卓手机;录音输出为PCM格式。1000名来自中国不同口音区域的发言人参与采集。MagicData中文手机录音音频语料库由MagicData有限公司开发,免费发布供非商业使用。
MDT-AD020 美国英语手机朗读音频数据集
试听音频
MDT-AE067 韩语双工自然对话数据集
基于独立音轨采集技术精准分离重叠语音与即兴打断,真实呈现韩语特有的敬语层级、情感性尾音变化和快速话轮转换。数据集包含多说话人角色标注与场景标签,助力AI掌握韩语文化语境下的复杂对话逻辑与情感分析。
MDT-AF001 中文普通话朗读音频数据集
试听音频
MDT-RI002 粤语高质量口语式语音数据集
该数据集专为训练更懂口语表达的AI模型打造,有利于提升粤语语音识别的自然交互能力,覆盖多场景真实对话,由多样化人群录制,字准率高。针对粤语九声调、懒音、俚语等特性优化标注,严格保证音字匹配质量。完整语句结构与符合口语习惯的标点设计,帮助模型精准捕捉粤语特有的停顿节奏和语气词用法,攻克方言识别中的泛化瓶颈。
Magic Data 数据优势有哪些?
合规性
符合ISO/IEC 27001和ISO/IEC 27701:2019标准认证
多维度
音频、文本、图像、音视频多模态数据
覆盖性
涵盖多领域的对话式、朗读式及自发式数据
高精度
人机协同高精度标注
Notice
×
TOP
联系我们