urduhack/roberta-urdu-small | ATYUN.COM 官网-人工智能教程资讯全方位服务平台

模型:

urduhack/roberta-urdu-small

任务:

填充掩码

类库:

PyTorch JAX Transformers

语言:

其他:

roberta roberta-urdu-small urdu AutoTrain Compatible

许可:

mit

模型介绍文件清单

中文

roberta-urdu-small

Overview

Language model: roberta-urdu-small Model size: 125M Language: Urdu Training data: News data from urdu news resources in Pakistan

About roberta-urdu-small

roberta-urdu-small is a language model for urdu language.

from transformers import pipeline
fill_mask = pipeline("fill-mask", model="urduhack/roberta-urdu-small", tokenizer="urduhack/roberta-urdu-small")

Training procedure

roberta-urdu-small was trained on urdu news corpus. Training data was normalized using normalization module from urduhack to eliminate characters from other languages like arabic.

About Urduhack

Urduhack is a Natural Language Processing (NLP) library for urdu language. Github: https://github.com/urduhack/urduhack

作者:

Urduhack

数据集大小:

966.49 MB