数据集:
super_glue
语言:
en计算机处理:
monolingual大小:
10K<n<100K语言创建人:
other批注创建人:
expert-generated源数据集:
extended|other许可:
license:unknown"super_glue"是一个新的基准数据集,类似于GLUE,包含一组更难的语言理解任务、改进的资源和一个新的公开排行榜。
BoolQ(布尔问题,Clark et al.,2019a)是一个问答任务,每个样本由一个简短段落和一个关于该段落的是/否问题组成。问题是由Google搜索引擎的用户匿名提供的,之后与包含答案的维基百科文章的段落配对。我们按照原始工作使用准确率进行评估。
"test"的示例如下:
axg"test"的示例如下:
boolq"train"的示例如下:
cb"train"的示例如下:
copa"train"的示例如下:
所有拆分的数据字段相同。
axbtest | |
---|---|
axb | 1104 |
test | |
---|---|
axg | 356 |
train | validation | test | |
---|---|---|---|
boolq | 9427 | 3270 | 3245 |
train | validation | test | |
---|---|---|---|
cb | 250 | 56 | 250 |
train | validation | test | |
---|---|---|---|
copa | 400 | 100 | 500 |
@inproceedings{clark2019boolq, title={BoolQ: Exploring the Surprising Difficulty of Natural Yes/No Questions}, author={Clark, Christopher and Lee, Kenton and Chang, Ming-Wei, and Kwiatkowski, Tom and Collins, Michael, and Toutanova, Kristina}, booktitle={NAACL}, year={2019} } @article{wang2019superglue, title={SuperGLUE: A Stickier Benchmark for General-Purpose Language Understanding Systems}, author={Wang, Alex and Pruksachatkun, Yada and Nangia, Nikita and Singh, Amanpreet and Michael, Julian and Hill, Felix and Levy, Omer and Bowman, Samuel R}, journal={arXiv preprint arXiv:1905.00537}, year={2019} } Note that each SuperGLUE dataset has its own citation. Please see the source to get the correct citation for each contained dataset.
感谢 @thomwolf 、 @lewtun 、 @patrickvonplaten 添加此数据集。