超大规模的中文自然文本数据集——CTW

更新于 2018年3月10日 机器学习
我来说两句
PaperWeekly   网页版 2018-03-09 18:05
视觉 自然语言处理 行业动态
【中文自然文本数据集】Chinese Text in the Wild 清华大学和腾讯共同推出了一个超大规模的中文自然文本数据集——CTW,该数据集包含32,285张图像和1,018,402个中文字符,规模远超此前的同类数据集。 论文链接:http://t.cn/RE3iscP 数据集链接:http://t.cn/REEwDUq

 

回复