模型:
it5/it5-base-news-summarization
本仓库包含在 Fanpage 和 Il Post 语料库上针对新闻摘要进行微调的 IT5 Base 模型的检查点,作为 Gabriele Sarti 和 Malvina Nissim 合著的论文 IT5: Large-scale Text-to-text Pretraining for Italian Language Understanding and Generation 实验的一部分。
其他发布材料的详细概述可在 gsarti/it5 存储库中找到。有关报告得分和评估方法的其他详细信息,请参阅论文。
可以在Tensorflow、Pytorch和JAX中直接使用模型检查点,作为管道的一部分使用:
from transformers import pipelines newsum = pipeline("summarization", model='it5/it5-base-news-summarization') newsum("Dal 31 maggio è infine partita la piattaforma ITsART, a più di un anno da quando – durante il primo lockdown – il ministro della Cultura Dario Franceschini ne aveva parlato come di «una sorta di Netflix della cultura», pensata per «offrire a tutto il mondo la cultura italiana a pagamento». È presto per dare giudizi definitivi sulla piattaforma, e di certo sarà difficile farlo anche più avanti senza numeri precisi. Al momento, l’unica cosa che si può fare è guardare com’è fatto il sito, contare quanti contenuti ci sono (circa 700 “titoli”, tra film, documentari, spettacoli teatrali e musicali e altri eventi) e provare a dare un giudizio sul loro valore e sulla loro varietà. Intanto, una cosa notata da più parti è che diversi contenuti di ITsART sono a pagamento sulla piattaforma sebbene altrove, per esempio su RaiPlay, siano invece disponibili gratuitamente.") >>> [{"generated_text": "ITsART, la Netflix della cultura italiana, parte da maggio. Film, documentari, spettacoli teatrali e musicali disponibili sul nuovo sito a pagamento."}]
或使用autoclasses加载:
from transformers import AutoTokenizer, AutoModelForSeq2SeqLM tokenizer = AutoTokenizer.from_pretrained("it5/it5-base-news-summarization") model = AutoModelForSeq2SeqLM.from_pretrained("it5/it5-base-news-summarization")
如果您在研究中使用了该模型,请引用我们的工作:
@article{sarti-nissim-2022-it5, title={{IT5}: Large-scale Text-to-text Pretraining for Italian Language Understanding and Generation}, author={Sarti, Gabriele and Nissim, Malvina}, journal={ArXiv preprint 2203.03759}, url={https://arxiv.org/abs/2203.03759}, year={2022}, month={mar} }