数据集:
billsum
许可:
cc0-1.0预印本库:
arxiv:1910.00523源数据集:
original批注创建人:
found语言创建人:
found大小:
10K<n<100K计算机处理:
monolingual语言:
en任务:
摘要生成BillSum是对美国国会和加利福尼亚州议案进行摘要。
有几个特征:
'train'的示例如下所示。
{ "summary": "some summary", "text": "some text.", "title": "An act to amend Section xxx." }
所有拆分的数据字段都是相同的。
默认name | train | ca_test | test |
---|---|---|---|
default | 18949 | 1237 | 3269 |
数据包括三个部分:美国训练议案、美国测试议案和加利福尼亚测试议案。美国议案是根据美国政府出版局(GPO)提供的服务收集的,根据CC0-1.0许可证使用。2015-2016届的加利福尼亚州议案可以从立法机构的 website 获取。
谁是源语言的制作人?@misc{kornilova2019billsum, title={BillSum: A Corpus for Automatic Summarization of US Legislation}, author={Anastassia Kornilova and Vlad Eidelman}, year={2019}, eprint={1910.00523}, archivePrefix={arXiv}, primaryClass={cs.CL} }