公司
Blog
blog
21
May
17
Browse: 209
MagicHub.io开源社区又上新啦!近千小时数据集免费下载!

当前,新一轮技术革命和产业变革正在孕育兴起,推动人工智能为代表的数字技术加速演进,人类快速向智能化社会迈进。

中国信息通信研究院今年4月发布的《人工智能核心技术产业白皮书》认为,人工智能已全面覆盖社会运行的基本要素,提升全局运转效率。未来,人工智能将像水、电一样无处不在,颠覆和变革每一个行业。

数据对人工智能发展起到重要支撑作用,人工智能模型需要海量数据进行训练和优化。在数据、算法和算力三大核心要素中,算法为中心逐渐向数据为中心转变。数据决定机器学习上限,只有研发人员重视数据,才能训练出更精准的模型。著名机器学习专家吴恩达认为,如果更多地强调以数据为中心而不是以模型为中心,那么机器学习将快速发展。

755小时普通话音频数据集

为推动人工智能技术发展,爱数智慧推出MagicHub.io数据开源社区,向全球开发者们陆续开源大量数据。近期,爱数智慧在社区继续开源数据集,开源了一批755小时的普通话音频数据集。该数据集曾在OpenSLR开源,此开源数据集也将链接到该社区,供开发者们免费下载

社区开源的755小时、近60GB的普通话音频数据集,采自爱数智慧中文全领域手机朗读语料库数据产品,该产品总时长为10566.9小时。此数据曾为约翰·霍普金斯大学语言和言语处理中心的科研成果"Exploring Methods for the Automatic Detection of Errors in Manual Transcription "提供了重要理论依据与数据支撑。

印尼语和马来语对话数据集

爱数智慧本周在开源社区上传了印尼语和马来语对话音频数据集,为开发者提供高质量的对话式AI训练数据。

印尼语对话音频数据集采集超过800多人的自由对话,通过室内环境采集,采集人为印尼人本地人。爱数智慧在社区开源5个小时印尼语对话音频数据集。点击此处下载

马来语对话音频数据集采集近700位马来西亚人自由对话,通过室内环境采集。爱数智慧开源5个小时马来语对话音频数据集。点击此处下载

MagicHub.io数据开源社区目前上传了英语、西班牙语、意大利语、韩语、日语等外语数据集;中文普通话、粤语、四川话、上海话等方言数据集;车载噪音数据集;发音词典等。

国家十四五规划和2035年远景目标首次明确推动开源社区发展,目前中国开源项目正处在高速发展阶段,各大企业纷纷拥抱开源,加大开源项目建设,加快形成社区开源生态。

MagicHub.io数据开源社区秉持“共享共建,奉献创新、共同发展”精神,为行业提供开源的对话式AI训练数据。爱数智慧目前已在社区开源30多组近1000小时数据集。同时鼓励数据所有者在社区开源数据集,让更多数据开源出来,与开发者共建共享。

Share
Previous
Page
喜报|爱数智慧荣获“阿里云2021年度优秀供应商”
Next
Page
爱数智慧加入英特尔AI百佳计划 为AI行业提供全方位的数字化基建!
Popular Tags
Latest Blogs
喜报|爱数智慧荣获“阿里云2021年度优秀供应商”

2021阿里云首届外包管理大会于6月8日在杭州举行,大会以“聚势、创新、共赢”为主题,邀请来自全球的供应商高层领导、行业精英共同出席。大会期间,阿里云对本年度优秀供应商进行表彰,爱数智慧凭借创新的技术、高效率高质量的交付以及满意的服务,从众多供应商中脱颖而出,荣获“阿里云 2021年度优秀供应商”。

21
May
17
爱数智慧加入英特尔AI百佳计划 为AI行业提供全方位的数字化基建!

5月20日,英特尔在2021第二届深圳(国际)人工智能展公布了第五期AI百佳创新激励计划创新团队名单,爱数智慧凭借深厚的创新实力成功加入英特尔AI百佳计划。

21
May
17
MagicHub.io开源社区上新啦!快来下载车载开源数据!

为了帮助智能车载系统的落地和优化,爱数智慧近期在MagicHub.io数据开源社区,更新开源了可用于车载系统的数据集:车载噪音数据集 和车载普通话朗读数据集。

21
May
17
ALL in数字化转型 看数据如何赋能银行4.0时代

全球数字经济浪潮下,数字化转型成为各个行业关注和发展的重点,而智能客服、智能营销、智能风控等在银行业落地应用,人工智能的价值逐渐凸显,人工智能成为银行数字化转型新引擎。

21
May
17
官宣 | MagicHub.io数据开源社区上线啦!Daniel Povey等大咖疯狂打CALL

1969年,Unix 源代码在 Unix 社区自由共享,人类历史上首次发起开源动作;

1991年,开源系统Linux内核问世;

1998年,网景通讯将源代码开放,“开源”一词首次出现;

2005年, 一个叫Git 的SCM工具出现,托管式的Git 代码仓库诞生;

……

21
May
17
销售部
购买数据集或者获取数据采集/标注服务评估报价,请填写此表单。
姓名
*
公司名称
*
邮箱地址
*
电话
*
详情
国家
城市
提交
资源部
如果您想成为爱数智慧的数据采集和标注团队,请填写此表单。
承接数据采集项目
语种*
地区*
承接数据标注项目
语种*
联系信息
姓名*
公司名称*
邮箱地址*
电话*
项目案例*
地址*
提交
市场部
如果您想转载爱数智慧的文章或者告知我们展会信息,请填写此表单。
姓名
*
公司名称
*
邮箱地址
*
电话
*
详情
提交
人力资源部
如果您想要加入爱数智慧,成为团队的一员,请填写此表单。
姓名
*
邮箱地址
*
电话
*
职位
*
上传简历
提交
样例下载
姓名*
邮箱*
电话*
公司名称*
职位
部门
公司产品
我还对以下数据感兴趣
语种:
风格
场景

我们会进行电话回访,确认信息后将提供数据集下载方式。
提交
提交成功
我们的工作人员将尽快与您联系。
页面将在3秒后自动关闭
>
TOP