首页 > 编程札记 > 编程

自然语言常用数据集

阅读：评论：0

自然语言常用数据集

自然语言常用数据集

转自：

Treebanks and annotated corpus useful for training POS tagger, parser etc

Penn Treebank .html
WSJ Corpus
NEGRA German corpus /
Tiger corpus /
alpino Treebank /
Bultreebank /
Turin University Treebank /
prague dependency Treebank .0/

Semantic relation annotated corpus

propbank
Nombank .html
framenet /
salsa .php?id=index

Text classification corpus

Reuters dataset /
news group datasets /

Parallel corpus used in machine translation

EMILE /

Text summarization

DUC-2001, 2002, 2003, 2004, 2005, 2006, 2007 .html
TAC-2008, 2009, 2010, 2011, 2012, 2013, 2014, 2015 /
Gigawords
LCSTS .html

Machine Reading

CNN
Microsoft .09268
Microsoft Marco /
SQuAD

Others

TREC
SemEval .php?id=tasks
Microsoft COCO: /

本文发布于:2024-01-27 17:53:14，感谢您对本站的认可！

本文链接：https://www.4u4v.net/it/17063491941752.html

版权声明：本站内容均来自互联网，仅供演示用，请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系，我们将在24小时内删除。

上一篇：自学深度学习，这些途径可以获取数据集

下一篇：[Draft]iOS.Architecture.16.Truth

标签：自然语言常用数据

留言与评论（共有 0 条评论）

推荐文章

排行榜

热门标签

我要关灯

我要开灯
返回顶部