公司
Blog
blog
21
Apr
15
Browse: 201
官宣 | MagicHub.io数据开源社区上线啦!Daniel Povey等大咖疯狂打CALL

1969年,Unix 源代码在 Unix 社区自由共享,人类历史上首次发起开源动作;

1991年,开源系统Linux内核问世;

1998年,网景通讯将源代码开放,“开源”一词首次出现;

2005年, 一个叫Git 的SCM工具出现,托管式的Git 代码仓库诞生;

……

开源,已经扎根在互联网基因深处,深刻改变互联网发展模式。

开源的历史,俨然是一部波澜壮阔的互联网发展史。

自达特茅斯会议人工智能概念提出以来,人工智能发展多次起落,随着技术的变革,互联网、大数据、云计算、5G的发展,人工智能在人类舞台正式大展拳脚。

人工智能开启了人类下一个纪元,开源继续扮演着重要角色,用于机器学习和AI训练的数据开源平台先后涌现,开发者们继续贡献着人类的智慧,开源、开放、自由和协作的精神推动人工智能不断发展。

政府、公益机构和个人将数据分享出来,为全球人工智能输送“燃料”,越来越多公司、大学、团体和个人也加入开源队伍,Kaggle、UCI、OpenML、ImageNet、OpenSLR等平台开源了大量图像、文本和语音数据。数据成为人工智能领域开源精神的核心载体。

在此背景下,MagicHub.io数据开源社区应运而生,并于4月15日正式发布。爱数智慧目前拥有全球领先的对话式AI语音数据集,并在业界首次通过自主开发的开源平台与第三方的各产业伙伴进行共享,这可能会颠覆目前的产能瓶颈以及用户的数据使用习惯。

语音识别开源工具Kaldi之父Daniel Povey等数十位国内外开发者、人工智能领域大咖为MagicHub.io数据开源社区疯狂打CALL:

视频:大咖们为MagicHub开源社区打CALL

大量结构化、多领域和多场景数据集上传到MagicHub.io社区,社区对数据集多维度细分,帮助AI开发者快速找到适合自己模型的数据集,从而节省开发者大量精力,将时间专注在模型开发和优化上。

MagicHub.io数据开源社区秉持“共享共建、奉献创新,共同发展”精神,部分数据由爱数智慧上传,同时鼓励其他个人和团体在开源社区上传高质量、可靠的数据集,有开源数据需求可联系我们,让我们一起连接数据生产者与AI开发者,互相护持,构建创新。

图:MagicHub开源社区首页页面

目前,MagicHub.io数据开源社区首次开源30种用于人工智能训练/测试的数据集,包括中文对话数据集、中文客服数据集、英语对话数据集、上海方言对话数据集等。开源的数据集涵盖NLP、ASR、TTS数据集和LEX发音词典等,这些数据集按照语言、场景、应用领域等不同维度进行分类。

接下来,我们将在MagicHub.io社区持续开源高质量的数据集,并且增加更多板块,让MagicHub.io社区持续贡献,让创新和分享组成一股力量,共同打造一个高质量的人工智能数据开源社区。

开源是推动科技创新的一大源头,开源社区的打造已上升到国家层面,鼓励开源社区发展,健全知识产权体系。《“十四五”规划和2035年远景目标纲要》提到,要“支持数字技术开源社区等创新联合体发展,完善开源知识产权和法律体系,鼓励企业开放软件源代码、硬件设计和应用服务。”

人工智能开启开源的下一个纪元,你我一起参与!

重要事情说三遍:

下载开源数据集,请访问:https://magichub.io

下载开源数据集,请访问:https://magichub.io

下载开源数据集,请访问:https://magichub.io

Share
Previous
Page
喜报|爱数智慧荣获“阿里云2021年度优秀供应商”
Next
Page
爱数智慧加入英特尔AI百佳计划 为AI行业提供全方位的数字化基建!
Latest Blogs
喜报|爱数智慧荣获“阿里云2021年度优秀供应商”

2021阿里云首届外包管理大会于6月8日在杭州举行,大会以“聚势、创新、共赢”为主题,邀请来自全球的供应商高层领导、行业精英共同出席。大会期间,阿里云对本年度优秀供应商进行表彰,爱数智慧凭借创新的技术、高效率高质量的交付以及满意的服务,从众多供应商中脱颖而出,荣获“阿里云 2021年度优秀供应商”。

21
Apr
15
爱数智慧加入英特尔AI百佳计划 为AI行业提供全方位的数字化基建!

5月20日,英特尔在2021第二届深圳(国际)人工智能展公布了第五期AI百佳创新激励计划创新团队名单,爱数智慧凭借深厚的创新实力成功加入英特尔AI百佳计划。

21
Apr
15
MagicHub.io开源社区又上新啦!近千小时数据集免费下载!

近期,爱数智慧在社区继续开源数据集,开源了一批755小时的普通话音频数据集。该数据集曾在OpenSLR开源,此开源数据集也将链接到该社区,供开发者们免费下载。

21
Apr
15
MagicHub.io开源社区上新啦!快来下载车载开源数据!

为了帮助智能车载系统的落地和优化,爱数智慧近期在MagicHub.io数据开源社区,更新开源了可用于车载系统的数据集:车载噪音数据集 和车载普通话朗读数据集。

21
Apr
15
ALL in数字化转型 看数据如何赋能银行4.0时代

全球数字经济浪潮下,数字化转型成为各个行业关注和发展的重点,而智能客服、智能营销、智能风控等在银行业落地应用,人工智能的价值逐渐凸显,人工智能成为银行数字化转型新引擎。

21
Apr
15
销售部
购买数据集或者获取数据采集/标注服务评估报价,请填写此表单。
姓名
*
公司名称
*
邮箱地址
*
电话
*
详情
国家
城市
提交
资源部
如果您想成为爱数智慧的数据采集和标注团队,请填写此表单。
承接数据采集项目
语种*
地区*
承接数据标注项目
语种*
联系信息
姓名*
公司名称*
邮箱地址*
电话*
项目案例*
地址*
提交
市场部
如果您想转载爱数智慧的文章或者告知我们展会信息,请填写此表单。
姓名
*
公司名称
*
邮箱地址
*
电话
*
详情
提交
人力资源部
如果您想要加入爱数智慧,成为团队的一员,请填写此表单。
姓名
*
邮箱地址
*
电话
*
职位
*
上传简历
提交
样例下载
姓名*
邮箱*
电话*
公司名称*
职位
部门
公司产品
我还对以下数据感兴趣
语种:
风格
场景

我们会进行电话回访,确认信息后将提供数据集下载方式。
提交
提交成功
我们的工作人员将尽快与您联系。
页面将在3秒后自动关闭
>
TOP