最新发布!查看 MagicData 成品数据集

新闻

press images

社区上新 | 来自大湾区哥哥们的粤语数据集 可用在智能座舱智能家居场景 确定不来看看?

发布时间 : 2021-09-28     阅读量 : 583

图:MagicHub.com开源社区

“互联互通”是人们对未来科技的新幻想,如今物联网技术已经渗透到各行各业,与我们的生活息息相关,其中智能家居是物联网的重点应用领域。据艾瑞报告显示,2019年中国智能家电市场规模首次突破3000亿元,智能生活电器未来发展前景较好,预计在2020年到2022年间将有7%~9%的增长速度。

一起来看看MagicHub.com开源社区9月份又开源了哪些数据集↓↓↓

智能座舱数据集

目前汽车行业进入存量市场,市场竞争加剧推动了智能汽车的发展,智能座舱的技术水平决定了汽车的智能化程度。语音控制是智能汽车重要的应用场景,智能座舱要想实现更好的智能化体验,更敏捷的应答,车载AI模型需要大量的训练数据。此次MagicHub.com社区开源了用于车载模型训练的车载数据集,该数据集采用不同设备在真实车载环境下录制,确保AI模型识别的速度和准确性。

中文导航语料库 该语料库包含100条中文导航相关文本语料,语料内容包括导航控制、地点查询、POI(兴趣点)等。

中文车载朗读音频数据集 该数据集包含了8个小时的中文普通话朗读音频和转写文本,内容为车载环境下的综合语料,包含8480个由38名说话人提供的句子。

粤语车载朗读音频数据集 该数据集包含了5个小时的广式粤语朗读音频和转写文本,内容为车载环境中的数字串与命令控制,包含6219条由10名说话人提供的语料。

智能家居语料库

命令控制是智能家居的一项关键技术,它的实现需要人工智能加持,通过语音指令,操纵家居设备运作,从而实现家居的智能化和个性化。打造体验良好的智能家居命令控制,离不开语音识别、语音合成、自然语言理解等技术和相应训练数据。近期,MagicHub.com开源社区开源部分智能家居语料库(NLP),为AI开发者提供高质量的训练数据,用于模型的训练和测试。

韩语家居命令控制语料库 该语料库包含100条韩语命令控制相关文本语料,用于智能家居的命令控制训练。语料库包括家居生活常见的命令控制口语,如开关灯、空调温度调节、人机问答、设置定时等。

日语家居命令控制语料库

该语料库包含100条日语命令控制相关文本语料,语料库包括智能家居常见命令控制句子,例如灯光控制、洗衣机洗衣时间设定、联系人添加、空调温度调节等。

本次开源的数据集包含了NLP语料库和ASR朗读式数据两大类,适用于家居、车载的AI模型训练和测试。同时,开源社区还拥有适用于智能社交、智慧金融、智能终端等行业的开源数据集,涵盖超过20种语言和方言,欢迎AI开发者们下载使用。

即刻与 Magic Data 建立联系?

联系我们

TOP
联系我们