最新发布!查看 MagicData 成品数据集

新闻

press images

挑战赛 | ISCSLP 2022 CSSD 正式发布基线系统和开发训练集

发布时间 : 2022-07-25     阅读量 : 52

2022年7月4日起,由中国科学院声学研究所、西北工业大学、新加坡A*STAR信息通信研究所、上海交通大学以及Magic Data (北京爱数智慧科技有限公司) 联合主办的 “ISCSLP2022对话短语音说话人日志挑战赛” (ISCSLP 2022 Conversational Short-phrase Speaker Diarization Challenge, CSSD) 自开展以来,已经收到四十多支国内外研究机构、大学及知名企业的参赛队伍注册报名,包括 德国弗劳恩霍夫应用研究促进学会、微软亚洲研究院、日内瓦大学、德国奥格斯堡大学、中国科学技术大学、上海交通大学、西北工业大学、北京理工大学、DeepGram、百度、网易、喜马拉雅、特斯联等。2022年7月24日,主办方正式向参赛队伍开放开发训练集和基线系统。

报名持续进行中:magichub.com/join-competition

开发训练集

主办方针对赛道“对话短语音说话人日志(SD)准确率”开放了以下训练数据集:

1、MagicData-RAMC 包括351组多轮普通话对话,时长共计180小时。每组对话的标注信息包括转录文本、语音活动时间戳、说话人信息、录制信息和话题信息。说话人信息包括了性别、年龄和地域,录制信息包括了环境和设备。请参赛者查看邮件进行数据集下载。

2、评估集(Test),将于9月8日开放。

所有参与者都应遵守以下规则:

  1. DATA:只允许使用MagicData RAMC(openslr 123)、VoxCeleb Data(openslr 49)和CN-Celeb Corpus(openslr 82)。数据增强可以使用两个噪声数据集,即 MUSAN(openslr17), RIRNoise (openslr 28)。

  2. 严禁以任何形式使用测试集,包括但不限于使用测试数据集对模型进行微调或训练。

3.允许多系统融合。然而不鼓励使用具有相同结构的系统进行融合。

  1. 所有模型都应在允许的数据集上进行训练。具体来说,预训练模型不允许使用其他数据集(包括未标记的数据)。

5、最终解释权归主办方所有。

基线系统介绍

为了帮助参赛者快速、高质量完成模型开发和训练,主办方提供了基线系统,提供给参赛者使用。我们使用VBx系统作为我们的基线系统,该系统使用ResNet来进行说话人特征提取,使用AHC与VB-HMM 进行特征向量的聚类。

详细的使用教程请见 :

https://github.com/MagicHub-io/MagicData-RAMC

打分工具介绍

为了评价说话人日志系统的性能,我们提出了Conversational-DER (CDER) 的指标。传统的DER 可以在时间尺度上评估说话人分类系统的整体性能。但是,在实际对话中,有时较短的持续时间包含重要信息,基于时间尺度的系统评价标准难以反映短时片段的识别性能。因此我们提出了CDER ,在句子级别评估说话人日志系统。

详细信息请见 :

https://github.com/MagicHub-io/CDER_Metric

奖项设置

比赛分别设置一等奖、二等奖和三等奖,将评选出三组获奖团队/个人。一等奖团队/个人将获得OPPO Find系列手机一部(价值约5000元),同时,获奖者将有机会参加 ISCSLP 2022 会议进行报告分享。

基线系统答疑指导

对基线系统有任何疑问,请访问以下链接获取帮助,将有专家团队给予解答。

https://github.com/MagicHub-io/MagicData-RAMC#contents

竞赛主委会支持团队

挑战赛相关问题,请发送邮件至 open@magicdatatech.com,邮件标题为“ISCSLP CSSD挑战赛疑问”。

疑问将由以下组委会资深技术专家提供专业技术问答和指导。指导专家均在语音领域深耕多年,有着丰富研究和实战经验,相信参赛者们在他们的指导下能够得到启发与收获。

赛程设置

9月8日将发布评估集,请参赛者谨记比赛关键时间点,详情如下:

访问Magichub开源社区,获取更多数据集 https://www.magichub.com

即刻与 Magic Data 建立联系?

联系我们

TOP
联系我们