公司
blog
Blog
blog
21
Oct
20
Browse: 44
NCMMSC 2021 | 工业论坛大咖共话数据 爱数智慧CEO张晴晴论“当数据遇上开源”

第十六届全国人机语音通讯学术会议(NCMMSC 2021)于10月15日~18日在徐州隆重召开,爱数智慧以金牌赞助商身份参与此次盛会,通过展位、主题分享、竞赛论坛等方式,为与会嘉宾带来爱数智慧的数据产品、标注工具和技术成果。

17日下午工业论坛开展,论坛由西北工业大学教授谢磊主持,聚集爱数智慧、好未来等多家企业嘉宾现场做报告分享。爱数智慧创始人兼CEO张晴晴做《当数据遇上开源》的主题演讲,为在座嘉宾详细介绍爱数智慧的数据开源社区、标注工具和数据集产品,并呼吁业界更多机构和个人加入开源队伍,共同推动开源事业发展。 同期,爱数智慧主办的“对话式AI语音识别及说话人识别(ASR&SD)挑战赛”作为大会重要赛事,于16日竞赛论坛上圆满落幕,获奖参赛者现场成功案例分享吸引大批与会嘉宾,为大会增色不少。

共建开源生态推动AI创新

工业论坛现场张晴晴做主题分享

在AI行业,AI从业者普遍面临难以获取数据的痛点。张晴晴从事AI行业十多年,深知AI开发者对数据的需求程度,希望拥有数据的机构或个人能够将数据共享出来,利益到更多AI开发者。基于这一出发点,爱数智慧于今年4月份上线MagicHub.com开源社区,并将部分自有数据集开源到社区供开发者免费下载。 为了方便用户查找开源数据集,社区根据数据应用领域、场景和类型进行分门别类,用户可快速搜索和定位到想要的数据集。目前,为了更好地用户体验,数据集搜索页面仍在不断优化当中。此外,社区还有针对全球用户的英文搜索界面。社区在数据集呈现上,将看到每个数据集的概览,进入到单个数据集页面,可看到这个数据集详细的描述情况。 迄今为止,开源社区已拥有超过100个包含语音识别、语音合成、发音词典等不同类型的开源数据集,覆盖全球超过3000名开发者,数据集累计下载量超过7万小时。 MagicHub.com开源社区开源大量数据集外,社区还与各大高校和相关机构合作,通过组建开发者社群、开展培训和赛事,致力于打造全球AI开发者生态。目前,社区在培训上,与AI光影社、深蓝学院、清华大学语音和语言技术中心、51CTO等合作,为初入人工智能领域的AI从业者开发人工智能科普视频,为人工智能研究人员和算法工程师提供人工智能深度解析课程等。

社区构建的全球AI开发者生态

赛事开展上,社区共发起了ASR&SD挑战赛和NLP挑战赛两大赛事,吸引清华大学、北大、华为、小米、阿里巴巴等各大高校和企业数百个团体踊跃参与。同时,社区建立的开发者社区星辰大使,目前已覆盖超过35个高校学生,共同推广开源事业发展。

张晴晴表示:“希望更多行业大咖能够参与到开源社区生态培训机制里,向开发者分享更多关于行业认知,帮助更多的行业从业者,共同推动开源事业,促进行业创新。”

面向多模态的标注平台

随着技术的进步,目前数据处理难度越来越大,存在上百甚至上千维度的标签标注需求,因此,爱数智慧还为AI开发者提供免费的数据标注工具Annotator® 5.0 智能化标注平台SaaS版,该平台可进行标签自定义,用户可根据项目需求进行任意的标签配置。 目前行业多模态标注需求增加,特别针对相应的音视频联动标注,平台也将支持音视频的多模态标注。张晴晴介绍,目前标注平台SaaS免费版已支持音频和文本标注,未来还将支持图像、多模态等类型数据的标注。 对于平台即将上线的文本标注功能,张晴晴认为:“文本标注是整个人机交互过程中必不可少的环节。目前,平台的文本标注功能支持实体抽取、文本分类、文本翻译等。未来还将实现对意图识别、知识图谱、命名实体、关联关系等标注。” 和同类标注平台相比,Annotator® 5.0标注平台在进行文本命名实体类别管理上更加灵活,可对人名地名等进行任意删减操作。 开源是创新一大源头,行业创新离不开企业和机构的推动,爱数智慧通过打造开源社区、标注工具和开源数据,携手行业机构、高校和企业共同推进开源事业,打造开源生态,为开发者创新提供更多的资源和更优质的平台,以开源和创新之力加速行业变革的到来。

Share
Previous
Page
资讯 | Magic Data加入信通院“数据安全推进计划(DSI),共建健康规范的数据安全生态
Next
Page
AICon 2021 | 从数据原材料和生产工具看AI产业发展源动力
Latest Blogs
资讯 | Magic Data加入信通院“数据安全推进计划(DSI),共建健康规范的数据安全生态

Magic Data加入信通院“数据安全推进计划(DSI),共建健康规范的数据安全生态

21
Oct
20
AICon 2021 | 从数据原材料和生产工具看AI产业发展源动力

2021 年是对话式 AI爆发元年,想要推动对话式人工智能的落地,除了依靠人机交互技术外,更需要百倍千倍以上规模的训练数据量。

21
Oct
20
生态合作 | Magic Data 与亚马逊云AWS开展生态合作 AI数据处理系统迈向全球化

由Magic Data打造的Annotator ® 5.0智能化AI数据标注平台已通过亚马逊云科技基础技术审核(FTR),正式成为亚马逊云科技合作伙伴网络中的 ISV 合作伙伴。

21
Oct
20
喜讯 | Magic Data成为信通院个人信息保护合规审计推进小组成员单位,助推个人信息保护合规生态建设

在中国信息通信研究院云计算与大数据研究所牵头下,个人信息保护合规审计推进小组成立。截至2021年11月19日,Magic Data与其他146家企业经严格审核,正式成为“推进小组”成员单位,

21
Oct
20
爱数智慧张晴晴荣膺《财富》2021年中国最具影响力的商界女性未来榜

2021年11月9日,《财富》公布“2021中国最具影响力的商界女性榜和中国最具影响力的商界女性未来榜”,爱数智慧创始人兼CEO张晴晴与微软亚洲研究院陈薇、中兴通讯崔丽、埃森哲大中华区朱虹、华大集团朱岩梅等49名商界女性入选中国最具影响力的商界女性未来榜。

21
Oct
20
销售部
购买数据集或者获取数据采集/标注服务评估报价,请填写此表单。
姓名
*
公司名称
*
邮箱地址
*
电话
*
详情
国家
城市
提交
销售部
购买Annotator5.0®私有化部署版,请填写此表单。
姓名
*
公司名称
*
邮箱地址
*
电话
*
详情
国家
城市
提交
资源部
如果您想成为爱数智慧的数据采集和标注团队,请填写此表单。
承接数据采集项目
语种*
地区*
承接数据标注项目
语种*
联系信息
姓名*
公司名称*
邮箱地址*
电话*
项目案例*
地址*
提交
市场部
如果您想转载爱数智慧的文章或者告知我们展会信息,请填写此表单。
姓名
*
公司名称
*
邮箱地址
*
电话
*
详情
提交
人力资源部
如果您想要加入爱数智慧,成为团队的一员,请填写此表单。
姓名
*
邮箱地址
*
电话
*
职位
*
上传简历
提交
样例下载
姓名*
邮箱*
电话*
公司名称*
职位
部门
公司产品
我还对以下数据感兴趣
语种:
风格
场景

我们会进行电话回访,确认信息后将提供数据集下载方式。
提交
提交成功
我们的工作人员将尽快与您联系。
页面将在3秒后自动关闭
>
TOP