挑战赛 | ISCSLP2022中英混语音识别挑战赛成绩发布

发布时间 : 2022-09-23 阅读量 : 2408

2022年8月12日起，由Magic Data、好未来、清华大学、中国科学院声学研究所联合主办“ISCSLP2022中英混语音识别挑战赛*(ISCSLP 2022 Chinese-English Code-Switching ASR Challenge, CSASR)。”

自开展以来，共收到四十多支国内外研究机构、知名企业及高校的参赛队伍注册报名，包括滴滴、搜狗、小鹏、虎牙、网易游戏、有道、荔枝FM、特斯联、网易游戏、中移在线、苏州驰声、堪萨斯州立大学、中科院、华中科技大学、中国科学技术大学、西北工业大学、厦门大学、天津大学等。

2022年9月23日，主办方正式公布本次挑战赛成绩排名。

注：本次挑战赛已纳入国际会议 ISCSLP，"MagicHub中英混语音识别挑战赛"更名为"ISCSLP 2022 中英混语音识别挑战赛（ISCSLP 2022 Chinese-English Code-Switching ASR Challenge, CSASR）"。

「竞赛结果与排名」

经过激烈的角逐，本次ISCSLP2022中英混语音识别挑战赛获奖队伍如下，恭喜获奖团队！

「挑战赛背景」

近年来，全球化进程发展迅速，人们在日常交流中经常会出现中文语境下夹杂其他语种的现象，这种语言现象称为语种混杂（Code-Switching）。这样的表达方式，尤其是中英文混杂的语音表达在应用场景中非常常见，主要包含两种表现形式：一是语言穿插表达“Oh, My God 我的电脑死机了”，二是在一种主要语言中混合入另外一种语言“我要上Coursera学习Machine Learning课程”，这样的表达方式都被认为是正确并且符合语法的。

随着语音识别设备的普及，如何让机器更好的学习和理解人类复杂多变的语言，成为不少ML研究者和从业者面临的巨大挑战。而数据的匹配度和丰富性，则是推动语音识别系统性能提升的最重要因素之一，通过高质量的结构化数据进行训练提升识别率，才能让机器领会说话人意图和指令，以作出更加精准的响应。本次挑战赛希望与企业、机构及高校携手，共同探索中英混对话AI领域的创新发展。

「打分工具介绍」

使用开源的打分工具Sclite进行打分。评分指标采用混合错误率（Mixed Error Rate, MER），即对中文计算字错误率、对英文计算词错误率。选手需提交GBK编码格式的识别结果。

打分样例请见：https://github.com/MagicHub-io/CSASR_Challenge/blob/main/dev_scoring_sclite.sh

「致谢」

感谢来自Magic Data、好未来、清华大学、中国科学院声学研究所在语音领域深耕多年，有着丰富研究和实战经验的专家，作为竞赛组委会成员，全程给予答疑支持和指导。

感谢SegmentFault思否开发者社区、稀土掘金技术社区、示说网等多家社区的大力支持。

后续我们将会对业界开放基础算法框架，同时也寻求学术和工业界在该问题的先进算法和技术，携手共建更优的解决方案。

产品推介｜LLM多领域超自然SFT多轮对话文本数据集

晴数智慧深耕对话式AI领域多年，构建了累计千万轮LLM多领域超自然SFT多轮对话文本数据集，覆盖近20个语种及方言，语料话题分布广泛，涉及休闲娱乐、衣食住行、教育医疗等近20个领域。

勇立潮头！高品质SFT语音数据实现Zero-Shot语音复刻大模型

文本到语音合成（Text to Speech，TTS）作为生成式人工智能（Generative AI 或 AIGC）的重要课题，在近年来取得了飞速发展。为了实现高效合成既自然又高质量的人类语音，有不少机构及企业都进行了相关项目的研究，包括微软亚洲研究院机器学习组和微软 Azure 语音团队去年推出的NaturalSpeech（https://speechresearch.github.io/naturalspeech2/）还有Meta今年发布的Voicebox（https://voicebox.metademolab.com/），都是利用大数据、大模型和零样本（zero-shot)合成技术，实现语音合成的音色、韵律、风格的多样性的代表。

巴别塔再现？高质量端到端数据助力Meta推出AI模型SeamlessM4T

追求卓越与无限的精神一直流淌在人类的基因里。圣经中有故事：在古代，人们说着同一种语言，决定建造一座高耸入云，塔顶能触及天堂的塔，被称为巴别塔，以彰显人类的力量和创造力。然而上帝看到人类的意图，并认为这个塔的建造是人们的傲慢和自大的表现。上帝让人类的语言变得不同，使他们无法相互理解。这导致了混乱和分裂，无法继续合作建造塔。语言不通让人类的沟通变得低效和困难。近日，Meta推出AI模型SeamlessM4T，该模型可翻译和转录近百种语言，似乎将破除因语言不同而导致的沟通障碍。可谓是人类构建“巴别塔”的又一次尝试。

助力数据要素市场标准化，晴数智慧发布大模型数据集企业标准

数据确权授权的标准制定，首先是对数据进行分级分类。结合在高质量数据上多年积累，晴数智慧首发了大模型数据集企业标准。晴数智慧将大模型数据集生产分为L1到L3三个标准，级别越高，数据精度越高。晴数智慧希望通过这套企业标准划分不同的数据处理层级，规范并提升数据质量，并确保数据的可靠性、有效性和知识产权的清晰性。

晴数智慧推出MagicData-CLAM高质量SFT数据集，助力大模型实现更优效果

如果开源大模型使得企业不再制肘于自研大模型，那么基于大模型的生成式AI决胜关键将只有一个答案：数据。

新闻

挑战赛 | ISCSLP2022中英混语音识别挑战赛成绩发布

即刻与 Magic Data 建立联系？