最新发布!查看 MagicData 成品数据集
MDT-NLP-F024 中文TN正则文本语料库

MDT-NLP-F024 中文TN正则文本语料库

语种

中文

数量

100,736

数据内容

TN正则文本

文件格式

TXT

适用领域

自然语言处理

数据敏感项

版权所有者

Magic Data

样例

100001
另一队中国组合由邵奕俊担任舵手,最终排名第十四,落后冠军组合1.63秒。
另一队中国组合由邵奕俊担任舵手,最终排名第十四,落后冠军组合一点六三秒。

100002
第二局比赛中国队攻势不减,侯宇阳在23分33秒时将比分改写为3:0。
第二局比赛中国队攻势不减,侯宇阳在二十三分三十三秒时将比分改写为三比零。

100003
上半场比赛双方打成10-10平,这是超级碗历史上第四次半场分数持平。
半场比赛双方打成十比十平,这是超级碗历史上第四次半场分数持平。

没有找到想要的数据?

联系我们

数据集推荐

MDT-NLP-G001 中国POI地址库

MDT-NLP-F016 中文口语化日常聊天语料库

MDT-NLP-A003 俄语口语化日常聊天语料库

MDT-NLP-A024 中文儿童读物文本语料库

MDT-NLP-A025 英文命令控制文本语料库

MDT-NLP-F014 中文通讯类语料库

Magic Data 数据优势有哪些?

合规性

符合ISO/IEC 27001和ISO/IEC 27701:2019标准认证

多维度

音频、文本、图像、音视频多模态数据

覆盖性

涵盖多领域的对话式、朗读式及自发式数据

高精度

人机协同高精度标注

TOP
联系我们