为人工智能企业以及智能化转型的企业提供场景化的数据集以及数据采集和标注服务。
车载语音助手
改善驾驶过程中的车内系统交互体验,让用户畅享安全行驶与娱乐享受的双重驾乘生活。
消费级机器人
让智能技术更好地融入生活场景,加速娱乐、教育、陪伴等生活辅助类产品市场化。
语音商务及客户服务
助力商务系统更快速和精准地定位客户需求,优化应答效率,提高客户满意度。
智能家居控制
促进家居AIOT生态融合,享受触手可及的智能生活。
智慧医疗
助力企业搭建智能导诊系统和病历系统;从用户的语音交互中提取关键症状信息,降低诊前人力投入。
通过专业的数据采集和标注服务,将多源异构的数据转化成可识别的AI训练数据。
数据采集 >
人工智能模型需要大量的训练数据。对于缺乏经验的人来说,数据采集耗时且费力。 Magic Data 可以根据您的项目需求,提供定制化的数据采集服务,加快项目进程。
数据标注 >
模型从经过标注的数据中获取信息。数据质量越好,模型性能越稳定。 Magic Data 提供精细化的标注服务,释放数据的价值。
私有化部署 >
企业在日常运营中积累了大量数据。这些来自业务场景的数据将有针对性的提高特定场景下模型的性能。 Magic Data 数据标注平台支持私有化部署,充分保障数据安全的同时为企业提供高效可定制的数据标注服务。
我们提供优质的成品数据集来提升AI模型性能,让它们可以有效运行。我们的场景化数据集可以加速智能产品市场化进程,开拓不同的市场并触达更多的用户。
张晴晴
Magic Data 创始人兼CEO
-
语音技术专家、对话式AI先行者
-
中科院声学所副研究员、博士
-
法国国家实验室LIMSI-CNRS博士后
-
《财富》2021年中国最具影响力的商界女性未来榜
-
创业邦2021年最值得关注的女性创业者
-
中国科学院杰出科技成就奖
-
微软亚洲研究院“微软学者”奖学金获得者
-
CCF女计算机工作者委员会委员
数据安全
平台对数据进行加密并对传输、存储、交付等整个生产流程进行监控,确保所有流程可控可追溯。 Magic Data 服务和产品首批通过ISO/IEC 27701:2019标准认证,通过ISO9001、ISO27001、GDPR、CMMI3认证。 Magic Data 在数据处理上遵循 GDPR 法规和网络安全法,并由国际四大会计事务所提供数据安全合规服务。
数据质量
在数据采集环节,对数据进行实时审核,提高采集的质量;在标注环节,采用人机协同的方式,提升数据标注的准确率和一致性。
数据多元化
我们为虚拟助手&聊天机器人、智能客服、智能家居控制、内容审核等多个人工智能领域提供场景化的数据采集和标注服务。
数据规模
我们提供50多种语言的数据采集和标注服务,包含中文、英语、日语等常用语种,以及他加禄语、印地语等特色语种;公司具有丰富的海外项目经验,完成多个跨国数据采集和制作项目。
Magic Data 是人工智能数据服务领域的佼佼者 未来可期。
我们在带噪环境下的语音识别和对话类型的语音识别中,使用了近万小时的 Magic Data 自然对话面对面录音音频语料库,模型性能提升非常显著。在匹配的自然对话语音识别中,错误率下降了相对30%。同时,令我们感到惊喜的是,数据对于带噪环境下的控制类型语音,也能够带来相对10%的识别错误率降低。这说明该自然对话语料库不仅能够帮助模型提升对自然方式的识别能力,还增强了模型对抗噪的鲁棒性!
我们在高速路上测试了 Magic Data 的印尼语车载命令语料库。测试时,窗外常有高速行驶的车辆呼啸而过。令我们惊讶的是,在这样嘈杂的环境中,唤醒效果依然特别好。希望以后可以继续与 Magic Data 合作!
Magic Data 是人工智能数据服务领域的佼佼者 未来可期。
我们在带噪环境下的语音识别和对话类型的语音识别中,使用了近万小时的MagicData自然对话面对面录音音频语料库,模型性能提升非常显著。在匹配的自然对话语音识别中,错误率下降了相对30%。同时,令我们感到惊喜的是,数据对于带噪环境下的控制类型语音,也能够带来相对10%的识别错误率降低。这说明该自然对话语料库不仅能够帮助模型提升对自然方式的识别能力,还增强了模型对抗噪的鲁棒性!
我们在高速路上测试了 Magic Data 的印尼语车载命令语料库。测试时,窗外常有高速行驶的车辆呼啸而过。令我们惊讶的是,在这样嘈杂的环境中,唤醒效果依然特别好。希望以后可以继续与 Magic Data 合作!
定制化需求
需求确认
与评估
样例确认
签订合同
数据处理
数据交付
定制化需求
需求确认
与评估
样例确认
签订合同
数据处理
数据交付