现在连一支笔也卷起来了,配备文字识别OCR(Optical Character Recognition)摄像头。近年来文字识别也几乎成为了无处不在的便利小帮手。
对答如流的语音助手,到底有多少词汇量?是否和人类一样需要从ABC开始积累呢?答案是他们并不需要逐步积累,而是通过发音词典库,这个库中涵盖了语音助手能够识别的所有语音。
硬核拆解特斯拉Full Self-Driving Computer (FSD) 创新的底层技术,包含纯电动汽车 (BEV) 的感知神经网络 Occupancy Network (栅格网络)、Interactive Planning (交互规划)、Lanes Network (车道网格)、Auto Labeling (自动标注) 等方面的视觉自动驾驶技术。
Magic Data参编的人工智能国家标准《信息技术 智能语音交互测试方法》正式发布。由中国电子技术标准化研究院牵头,联合Magic Data、科大讯飞、小米、华为、腾讯、百度、阿里云等38家单位共同研制完成。
虚拟数字人根据驱动方式的不同可分为AI智能驱动型和真人驱动型(动作捕捉技术)。AI语音驱动虚拟数字人作为虚拟人落地的核心技术,不仅大幅节省了制作成本,同时精细化的培养了虚拟数字人口手合一的协调性。
10月27-28日, ICASSP 2022将在深圳龙岗珠江皇冠假日酒店举办,Magic Data创始人兼CEO张晴晴受邀出席,同时Magic Data将在展台S3参展。