最新发布!查看 MagicData 成品数据集

关于我们

让人工智能发展更快更强!

team.png

北京晴数智慧科技有限公司

晴数智慧(英文:Magic Data )是一家全球领先高质量数据集解决方案公司,为人工智能领域研发企业和科研机构提供高质量 AI 训练数据集及专业咨询服务。晴数智慧在传统采集标注基础上,围绕构建高质量数据,为客户提供 MLOps 闭环支撑,在数据咨询,生成,清洗,分类,微调,测试等环节,提供专业的 DaaS(Data as a Service) 解决方案。晴数智慧产品覆盖智慧出行、智慧金融、智能社交、智能家居、智能终端等五大行业,迄今服务了微软、高通、英伟达、阿里巴巴、百度、腾讯等国内外近 300 家合作伙伴。

Magic Data 入选北京市 2021 第一批专精特新“小巨人”企业、先后荣获“国家高新技术企业”、“中关村高新技术企业”、“中关村金种子企业”、“海淀区胚芽企业”等荣誉;担任中国信息协会理事,同时是中国计算机学会、中国人工智能学会会员单位。获得“阿里云 2021 年度优秀供应商”。通过 CMMI-3、微软 SSPA 认证,ISO/IEC 27701:2019 标准认证以及 ISO 27001、ISO 9001 标准认证。

Magic Data 核心团队

张晴晴

Magic Data 创始人兼 CEO

· 中科院声学所博士,曾任副研究员

· 法国国家实验室 CNRS 博士后

· 《财富》2021 年中国最具影响力商界女性(未来榜)

· 创业邦 2021 年最值得关注的女性创业者

· 中国科学院杰出科技成就奖

· 科学技术厅科学技术进步奖一等奖

· CCF 语音对话与听觉专委会委员 / CCF 智能汽车分会执行委员

· CCF 女计算机工作者委员会委员 / CCF 标准工作委员会委员

晴晴有话说

未来我们,无限可能

Magic Data 荣誉证书

honor-img honor-img honor-img honor-img
honor-img
honor-img
honor-img
honor-img

新闻中心

新闻中心

北京爱数智慧科技有限公司正式更名「晴数智慧」,高质量数据集助力AI大模型发展

北京爱数智慧科技有限公司品牌升级,中文名称正式更名“北京晴数智慧科技有限公司”,英文名称沿用Magic Data,进一步将业务推向高质量数据集的构建和解决方案领域。

张晴晴:对话数据推动AIGC——大模型底层数据探索

“Training data is technology” .数据即科技,OpenAI的联合创始人Ilya Sutskever在与知名科技媒体The Verge访谈中提到。ChatGPT自发布以来热度席卷全球,一周前惊艳亮相的GPT-4更是让人感叹我们迎来了AI发展的历史性时刻。然而我们也困惑,OpenAI为何不开源GPT-4?在我们看来,更多的奥秘或许存在于数据之中......本文是Magic Data创始人兼CEO张晴晴博士关于数据、大模型与生成式AI的观点分享。

MagicThoughts|让ChatGPT变得更智能的Finetuned数据集

尽管就目前来看ChatGPT对大部分问答都能基本做到“对答如流”。但是,ChatGPT本质上依旧是预训练模型驱动的产物,模型的成熟度、完善度对它回答的准确度有着很大的影响。

数据开源 | Magic Data开源基于ChatGPT的可扩展的对话数据集

在过去的一月里,人工智能领域中最火的话题莫过"ChatGPT"。MagicHub数据开源社区已开源部分基于ChatGPT的可扩展的对话数据集。

开源 | MagicData-RAMC :180小时中文对话式语音数据集正式发布

Magic Data联合中科院声学研究所、上海交通大学和西北工业大学,在Magichub开源社区正式开源180小时中文对话式语音数据集MagicData-RAMC。MagicData-RAMC是一批高质量且标注丰富的训练数据,可以很好地支持开发者完成语音识别和说话人日志相关的研究。

在过去的一年里,大语言模型一路高歌猛进,让人惊艳的产品不断被推出。语音大模型也迎来突破,其中就包括还原度越来越高的声音复刻技术。

即刻与 Magic Data 建立联系?

联系我们

TOP
联系我们