最新发布!查看 MagicData 成品数据集
MDT-AE085 葡萄牙语朗读音频数据集

MDT-AE085 葡萄牙语朗读音频数据集

语种

葡萄牙语

录音环境

室内

数据时长

396小时

录音语料

日常用语、新闻、控制命令、唤醒词、数字串

文件格式

WAV, TXT

语音参数

16 kHz, 16 bits

录音设备

手机

适用领域

语音识别

数据敏感项

版权所有者

Magic Data

音频样音

没有找到想要的数据?

联系我们

数据集推荐

MDT-AE017 菲律宾他加禄语朗读音频数据集—日常用语

【开源数据】
试听音频

MDT-AI101 西班牙语双工自然对话数据集

完整保留母语者高速对话中的语调跳跃、即兴打断和协同发言特征。通过独立音轨技术实现精准语音分离,搭配多说话人标注及场景分类,为AI模型提供应对西语多变语速、地域表达差异的强化训练基础。

MDT-AE049 韩语朗读音频数据集-新闻

试听音频

MDT-RJ001 日语高质量口语式语音数据集

该数据集专为训练更懂口语表达的AI模型打造,有利于提升日语语音识别的自然交互能力,覆盖多场景真实对话,由多样化人群录制。精准标注音调核位置及促音、拨音等特殊音节,字准率高。通过合理标点还原日语独有的呼吸停顿节奏,助力模型理解口语中的省略句式与情感粒子,提升交互自然度。

MDT-AA011 中文唤醒词命令词音频数据集

试听音频

MDT-AE082 印尼语对话音频数据集—室内

【开源数据】
试听音频

Magic Data 数据优势有哪些?

合规性

符合ISO/IEC 27001和ISO/IEC 27701:2019标准认证

多维度

音频、文本、图像、音视频多模态数据

覆盖性

涵盖多领域的对话式、朗读式及自发式数据

高精度

人机协同高精度标注

TOP
联系我们