最新发布!查看 MagicData 成品数据集

新闻

press images

案例|智慧教育:用AI训练数据打造领先教育科技产品

发布时间 : 2023-04-19     阅读量 : 340

用科技赋能教育是近年来教育领域中备受关注的话题。科技在教育领域中的应用,可以帮助教育者更加高效、个性化地实现教学目标,同时提高学习者的学习效果和体验。智慧教育项目集成各种先进的AI技术,例如语音识别和自然语言处理等,来实现个性化推荐、智能评估和自适应学习等功能。本文将介绍我们的客户如何通过打造英语口语智能评分系统为智慧校园注入活力。

客户概况

客户是国内领先的教育智能硬件服务商,依托其成熟教育生态,致力于以科技赋能校园的教学管理,为校园提供全场景的智慧校园解决方案。英语口语智能评分系统是客户贴合智能阅卷场景打造的一款智慧校园应用,通过AI模型对学生的英语口语表达智能评分,辅助教师考评学生学业发展水平,以及时有效的改进教学,减负增效。

需求与挑战

英语口语测评通常有朗读测评和口头表达测评两类题型。英语口试智能评分系统的核心模块是语音评测技术,包括发音错误检测、发音水平及口语表达能力评价。

针对侧重考核学生发音质量的朗读题型,测评系统的技术关键是测评文本与测评音频的时间对齐,即语音识别与切分。

对于口头表达能力的题型,技术方案主要是通过先识别学生的口头表达内容,输出为本,然后基于文本提取内容相关特征,进一步将识别文本作为测评文本,提取发音水平相关特征,与内容相关特征结合在一起,构成完整的评分特征。

综合来看,语音识别准确性与内容特征矢量化表征是关键。

Magic Data解决方案

Magic Data与客户就其产品功能需求及技术关键点进行了充分沟通,最终交付了成品数据集加定制化标注的数据解决方案。

针对系统语音识别准确性的要求,Magic Data提供了中国英语朗读数据集和美式英语与中式英语对话式数据集进行模型优化,数据领域包括:闲谈,经济,旅游,教育等。口语对话场景下,使用领域相关的对话式数据集可以用相对较少的数据量达到可观的模型性能提升。

使用的部分数据集产品:

MDT-ASR-F069 英语对话音频数据集

MDT-ASR-E040 中国英语交互朗读音频数据集

数据集覆盖领域:

在涉及自然语言处理的内容特征矢量化表征方面,由于参考答案空间无限大,可以有不同的角度、词汇和语法结构,需要引入专家系统参与评判。Magic Data与客户共同制定了标注标准,同时整合了数据采集与专家标注资源,通过自研Annotator智能化标注平台进行端到端数据处理,快速、高质量地完成了这部分数据的交付。

价值传递

Magic Data以伙伴式的合作模式为客户提供了数据和模型端到端的解决方案。

朗读测评技术和口头表达测评技术相结合的口语智能评分系统可以全面地评价学生的语言水平,客户通过此产品赢得了高校客户的认可,拓展了市场空间,实现了业务增长。

即刻与 Magic Data 建立联系?

联系我们

TOP
联系我们