最新发布!查看 MagicData 成品数据集
语音复刻大模型高品质数据集——东南亚

语音复刻大模型高品质数据集——东南亚

语种

他加禄语-菲律宾,马来语-马来西亚,泰语-泰国

数据风格

对话式&朗读式

音频格式

PCM

采样率

48kHz

比特率

16 bits

声道

1

人数

5,232

时长

2,425

As a new trend of AIGC, zero-shot speech synthesis has wide-ranging applications, including voice assistants, audiobooks, video game character voices, creating podcast, and real-time voice changer, among others. Magic Data has proactively designed and developed the "High-Quality Dataset for Voice Replication," which boasts a 48kHz high sampling rate, tens of thousands of contributors with diverse content, making it an excellent resource for achieving zero-shot speech synthesis.

没有找到想要的数据?

联系我们

数据集推荐

MDT-RI001 中文高质量口语式语音数据集

该数据集专为训练更懂口语表达的AI模型打造,有利于提升中文语音识别的自然交互能力,覆盖多场景真实对话,由多样化人群录制,字准率高。所有语句完整保留口语韵律特征,精准标注的停顿与标点助力模型学习中文节奏,显著提升识别模型对自然发音的包容性与交互流畅度。

MDT-AD027 日语朗读音频数据集—日常用语

试听音频

MDT-AF055 中文普通话朗读音频数据集

试听音频

MDT-AF025 菲律宾英语朗读音频数据集—智能座舱

试听音频

多风格音乐分轨数据集

现今,音乐行业的竞争越来越激烈,音乐的制作成本和时间成本都在不断增加。因此,提高音乐制作的效率和质量已成为音乐人关注的焦点。而音乐分轨数据集正是解决这个问题的有效工具之一。同时,本数据集的高质量分轨和风格特征也可以用于 AIGC、声源分离、自动作曲、编曲等环境。
试听音频

MDT-AE054 东北话对话音频数据集

试听音频

Magic Data 数据优势有哪些?

合规性

符合ISO/IEC 27001和ISO/IEC 27701:2019标准认证

多维度

音频、文本、图像、音视频多模态数据

覆盖性

涵盖多领域的对话式、朗读式及自发式数据

高精度

人机协同高精度标注

TOP
联系我们