公司
blog
Blog
blog
21
Oct
16
Browse: 314
小爱5岁啦!一路走来,有AI有你 ,这份大礼请收下!

小爱5岁啦!一路走来,有AI有你 ,这份大礼请收下!

5年,1826个日夜,43824个小时

5年很长, 足够婴儿牙牙学语到问出“十万个为什么”;

5年又很短, 它只是人生的十几分之一,历史一个片段,宇宙长河中闪光那一瞬;

5年时间, 足够一个国家完成一个发展规划;足够一个企业成长壮大。

5年前的现在,我们从0起步;五年后的现在,我们为100家以上国内外企业服务,积累超过20万自有数据集,打造1个数据标注平台,1个开源社区,荣获N个行业奖项。

Magic Data5岁啦!时光飞逝,在众多客户陪伴下,我们沐雨栉风,不负韶华;我们风雨同舟,用数据叩开AI新世界,实现腾飞与梦想。

凡皆过往,皆为序章。上一个五年,我们厚积薄发;下一个五年,我们砥砺前行!

恰逢Magic Data五周年之际,为感恩新老客户一直以来的陪伴,Magic Data将开展“5周年特别活动”:从10月15日到12月31日止,凡累计购买Magic Data600小时以上语音训练数据集,即可获赠180小时中文对话式训练数据集及20小时自然甜美中文TTS训练数据集。

20万+自有数据集产品

目前,Magic Data拥有超过20万自有训练数据集,其中超过12万小时对话式数据,超过6万小时朗读式数据,超过2万小时自发式数据,涵盖ASR、TTS、NLP、发音词典等。

Magic Data的数据服务语种超过60种语言和方言,既有常用语种如英语、中文、德语、法语、荷兰语、意大利语等,也有马来语、泰语、印尼语等特色语种。

数据在方言方面涵盖八大方言区方言,如粤语、上海话、四川话、闽南话等。Magic Data采集的对话数据来自自然、真实的对话场景,表达风格口语化,对话自然流畅。

Magic Data针对不同场景开发相应的数据集,数据集内容上丰富多样,如车载噪音、客服、线上会议、人机交互、自由对话、唤醒词等,满足不同应用场景下的模型训练。

为降低有限词汇(out of vocabulary)对识别率的影响,Magic Data研发了自主知识产权的发音词典标注系统。发音词典词条和Magic DataASR数据集相匹配,并且覆盖字词在真实场景下的发音,包含了每个字单独发音,以及上下文中的真实发音包括变调信息等。方言发音词典包含超过10万条通用式词条,从而加快OOV问题的解决。

其中热门数据如中文普通话数据量超过9万小时,英语超过2万小时,这些数据广泛应用于智慧出行、智慧金融、智能社交、智慧家居、智能终端等各大行业。

获赠一:180小时中文对话式数据集

客户购买超过600小时以上语音训练数据集,可获赠180小时中文对话式数据集。该中文对话数据集由湖南、山东、山西、四川等地超过600人参与录制,根据给定主题进行自由对话,话题丰富,对话内容包括科技产品、日常生活、文化娱乐等。数据集总时长为180小时。数据在安静室内录制,正确率可达97%以上。可用于智慧家居、智能社交、智能终端等各大场景。

获赠二:自然甜美中文TTS训练数据集

客户购买超过600小时以上语音数据集,获赠180小时中文对话式数据集同时,还获赠20小时自然甜美TTS训练数据集。

该数据集在专业TTS录音棚录制,录制设备为专业级高保真麦克风,音色为甜美女声,校对正确率达到99%。该数据产品话题涉及娱乐、家居、生活、金融等,可用于车载导航、智能家居、智慧金融等智能化场景。

Share
Previous
Page
挑战赛 | Magichub重口音对话语音识别挑战赛报名开始
Next
Page
榜单 | Magic Data上榜互联网周刊2022数字经济100强
Latest Blogs
挑战赛 | Magichub重口音对话语音识别挑战赛报名开始

Magichub重口音对话语音识别挑战赛5月10日起开始报名,欢迎学术界、产业界的团体及个人报名参赛。

21
Oct
16
榜单 | Magic Data上榜互联网周刊2022数字经济100强

Magic Data(北京爱数智慧科技有限公司)上榜互联网周刊2022 AI/大数据服务 “数字经济100强”。

21
Oct
16
测评 | Magic Data-RAMC数据集测评:西北工业大学冠军队分享

西工大音频语音与处理研究组 (ASLP@NPU) 同学们组队在挑战赛 “对话场景下的语音识别 (ASR)”赛道中荣获第一名,Magic Data已开源本次比赛的180小时数据集。

21
Oct
16
首批 | Magic Data等共10家企业推进中国通信院数据标注平台产品评测

中国信通院依托中国通信标准化协会联合Magic Data、百度、浩鲸云、OPPO、阿里云等十余家企业专家参与编制完成《大数据 数据标注平台技术要求》。

21
Oct
16
报告 | Magic Data入选艾瑞《中国面向人工智能的数据治理》行业研究报告

Magic Data入选艾瑞《中国面向人工智能的数据治理》行业研究报告,以数据重塑生产力,从数据采标处理流程确保安全隐私合规

21
Oct
16
销售部
购买数据集或者获取数据采集/标注服务评估报价,请填写此表单。
姓名
*
公司名称
*
职位
*
邮箱地址
*
电话
*

国家区号 + 联系方式

举例:+86 134xxxxxxxx

详情
国家
城市
提交
销售部
购买Annotator5.0®私有化部署版,请填写此表单。
姓名
*
公司名称
*
邮箱地址
*
电话
*

国家区号 + 联系方式

举例:+86 134xxxxxxxx

详情
国家
城市
提交
资源部
如果您想成为 Magic Data 的数据采集和标注团队,请填写此表单。
承接数据采集项目
语种*
地区*
承接数据标注项目
语种*
联系信息
姓名*
公司名称*
邮箱地址*
电话*

国家区号 + 联系方式

举例:+86 134xxxxxxxx

项目案例*
地址*
提交
市场部
如果您想转载 Magic Data 的文章或者告知我们展会信息,请填写此表单。
姓名
*
公司名称
*
邮箱地址
*
电话
*

国家区号 + 联系方式

举例:+86 134xxxxxxxx

详情
提交
人力资源部
如果您想要加入 Magic Data ,成为团队的一员,请填写此表单。
姓名
*
邮箱地址
*
电话
*

国家区号 + 联系方式

举例:+86 134xxxxxxxx

职位
*
上传简历
提交
样例下载
姓名*
邮箱*
电话*

国家区号 + 联系方式

举例:+86 134xxxxxxxx

公司名称*
职位
部门
公司产品
我还对以下数据感兴趣
语种:
风格
场景

我们会进行电话回访,确认信息后将提供数据集下载方式。
提交
提交成功
我们的工作人员将尽快与您联系。
页面将在3秒后自动关闭
联系我们
>
TOP