关于我们

structured data service and processing platform dedicated to providing audio

公司简介

北京爱数智慧科技有限公司成立于2016年,是一家领先的一站式AI数据服务商。爱数智慧全球总部设立在北京,并在香港设立分公司。公司在国内多地及东南亚建有数据处理中心。

爱数智慧“以为智能世界提供充足的数据生产力”为使命,为语音识别、语音合成、计算机视觉识别、自然语言处理等领域提供专业的数据采集和标注服务。

爱数智慧深入分析客户需求,结合应用场景与数据状态,为客户提供全方位的数据解决方案。通过超强执行力的过程管理推进项目进程,并以严格的质量管理保证交付。

爱数智慧有海量多语种多场景的语音数据集并广泛应用于金融、教育、科技互联网、交通出行、移动通信、科技制造等领域,协助提升语音识别模型性能。

2018年初,爱数智慧通过中关村高新技术企业认定;2018年8月,通过国家高新技术企业认定;2018年10月,获得海淀区“胚芽企业”称号; 2019年3月,获得中关村管委会“金种子企业”称号。2019年8月,在OpenSLR上发布中文普通话开源数据集。2019年10月,Dan Povey成为公司首席科学家顾问。

爱数智慧作为人工智能产业链的基础层,爱数智慧将多源异构的原始数据,经过清洗、标注转换成有价值的、可用于机器学习的结构化数据。

爱数智慧有海量多语种多场景数据集,有朗读、对话、自发式等多种风格,可用于训练基础AI模型。成品数据集说话人来自不同地区且年龄分布广泛,拓宽了数据的语音空间,从而降低客观差异对识别准确率的影响。
爱数智慧建立了一套完整的标注准则,保证数据保持一致性。同时,采用人机协同的数据处理平台,提高数据标注的效率和准确率。

 
爱数智慧针对性的提高模型在相关场景下的性能,爱数智慧提供数据定制服务。并建立了完整的标签体系,用于应对复杂的数据处理。用这些带有标签的数据来训练模型,将有效的提高模型的性能。