公司
blog
Blog
blog
21
Aug
31
Browse: 62
社区上新 | 新数据集刚推出即开源 确定不来尝鲜一下?

MagicHub.com开源社区

对话式AI的最高境界是兼顾响应的速度和应答质量,如果AI做到像人交流一样自然,响应速度间隔需要控制在200毫秒以内。那么,对话式AI需要将用户语音转换为文本,理解文本含义,搜索符合语境的最佳应答,最后使用文本转语音工具提供应答。每一步都需要运行多个 AI 模型,因此每个单独网络的可用执行时间约为 10 毫秒或更短。AI要想实现如此自然的应答,对话式训练数据必不可少。

近期,MagicHub.com开源社区开源几组对话式AI数据集,其中埃及阿拉伯语对话音频数据集和巴基斯坦英语朗读数据集为北京爱数智慧最新推出的数据集,并开源在社区供AI开发者用于模型训练或测试。

外语数据集

埃及阿拉伯语对话音频数据集

此开源数据集包含5.5小时的埃及阿拉伯语对话音频和转写文本,内容为2组说话人之间给定9组主题进行对话。

巴基斯坦英语朗读数据集—日常用语

此数据集包含了4个小时的巴基斯坦英语朗读音频和转写文本,内容为由7名说话人提供的2,191条日常用语语料。

中文数据集

中文普通话对话音频数据集—多通道 此数据集包含了10个小时的中文普通话对话音频和转写文本,内容为由3种录音设备(6通道)采集的30组说话人之间的360组给定主题对话。

方言数据集

南昌话对话音频数据集 此数据集包含4个小时的南昌话对话音频和转写文本,内容为2组说话人之间的6组给定主题对话。

长沙话对话音频数据集 此数据集包含了4.1个小时的长沙话对话音频和转写文本,内容为2组说话人之间的6组给定主题对话。

本次开源5个数据集总共近30个小时。迄今为止,社区开源超过25种语言,聚集超过3000名AI开发者,数据下载累计超过7000小时。 开源社区在数据开源上力求内容丰富、类型多元、数据质量高,覆盖各类语言,让数据为更多AI开发者所用,为缺少渠道和预算获取可靠数据集的AI开发者或者学生们提供开发帮助。

Share
Previous
Page
喜讯 | Annotator® 5.0智能化标注平台斩获“2021企业数字化转型最佳产品奖”
Next
Page
技术大咖齐聚爱数智慧人机交互技术论坛 | CNCC2021
Popular Tags
Latest Blogs
喜讯 | Annotator® 5.0智能化标注平台斩获“2021企业数字化转型最佳产品奖”

爱数智慧Annotator® 5.0智能化标注平台凭借创新的技术、实用前瞻的功能和个性化的良好体验,从众多候选产品中脱颖而出,一举斩获“2021企业数字化转型最佳产品奖”。

21
Aug
31
技术大咖齐聚爱数智慧人机交互技术论坛 | CNCC2021

CNCC2021【人机交互技术的机遇与挑战】技术论坛将于2021年10月28日13:00-16:00在深圳国际会展中心CC105B召开,本次论坛由CCF主办,爱数智慧赞助。

21
Aug
31
服贸会特别活动 | 爱数智慧自有数据集优惠3折起

爱数智慧20万小时自有数据集,涵盖30+语种,8大方言区方言的语音识别(ASR)和语音合成(TTS)数据集优惠3折起!

21
Aug
31
聚焦2021服贸会 | 爱数智慧正式上线Annotator® 5.0私有化部署版

Annotator® 5.0是北京爱数智慧为企业端和AI训练师为代表的用户端开发的一款智能化数据标注平台,平台分SaaS免费版和私有化部署版。

21
Aug
31
万元奖金等你拿 | 中文临床医学文本分词与命名实体挑战赛开启报名

本次NLP竞赛围绕中文临床医学文本内容,对医疗文本的分词和命名实体进行自然语言处理任务,以医疗问答为切入点,推动NLP技术创新,努力扩展到更多应用场景。

21
Aug
31
销售部
购买数据集或者获取数据采集/标注服务评估报价,请填写此表单。
姓名
*
公司名称
*
邮箱地址
*
电话
*
详情
国家
城市
提交
销售部
购买Annotator5.0®私有化部署版,请填写此表单。
姓名
*
公司名称
*
邮箱地址
*
电话
*
详情
国家
城市
提交
资源部
如果您想成为爱数智慧的数据采集和标注团队,请填写此表单。
承接数据采集项目
语种*
地区*
承接数据标注项目
语种*
联系信息
姓名*
公司名称*
邮箱地址*
电话*
项目案例*
地址*
提交
市场部
如果您想转载爱数智慧的文章或者告知我们展会信息,请填写此表单。
姓名
*
公司名称
*
邮箱地址
*
电话
*
详情
提交
人力资源部
如果您想要加入爱数智慧,成为团队的一员,请填写此表单。
姓名
*
邮箱地址
*
电话
*
职位
*
上传简历
提交
样例下载
姓名*
邮箱*
电话*
公司名称*
职位
部门
公司产品
我还对以下数据感兴趣
语种:
风格
场景

我们会进行电话回访,确认信息后将提供数据集下载方式。
提交
提交成功
我们的工作人员将尽快与您联系。
页面将在3秒后自动关闭
>
TOP