最新发布!查看 MagicData 成品数据集
MDT-NLP-F025 中文多音字文本语料库

MDT-NLP-F025 中文多音字文本语料库

语种

中文

数量

244,630条 (158个多音字)

数据内容

多音字

数据特点

多音字

文件格式

TXT

适用领域

自然语言处理

数据敏感项

版权所有者

Magic Data

样例

带钩子的这几个都是虚胖吧,连带爪(zhua3)子的铁男都不是真肉。
我看有找到四只二牛的但是我只找到两只全脸出镜的二牛狗爪(zhua3)子?
我晚点再盘一下牌吧,应该底牌的狼爪(zhao3)是miku的。

没有找到想要的数据?

联系我们

数据集推荐

MDT-NLP-B006 中葡平行语料库

MDT-NLP-A023 印地语新闻文本语料库

MDT-NLP-B001 中文对话语料库

MDT-NLP-F007 中文马来双语平行语料库

MDT-NLP-A031 意大利语智能家居命令控制语料库

MDT-NLP-B002 命名实体抽取语料库

Magic Data 数据优势有哪些?

合规性

符合ISO/IEC 27001和ISO/IEC 27701:2019标准认证

多维度

音频、文本、图像、音视频多模态数据

覆盖性

涵盖多领域的对话式、朗读式及自发式数据

高精度

人机协同高精度标注

TOP
联系我们