数据集:

musabg/wikipedia-tr

中文

? Türkçe Vikipedi Mayıs 2023

Bu veri kümesi, Türkçe Vikipedi'den alınan makalelerin bir derlemesi olup, maskeleme dil modelleme ve metin oluşturma görevleri için tasarlanmıştır.

?️ Etiketlemeler

Bu veri kümesindeki makaleler, özellikle belirli bir görev için etiketlenmemiş olup, veri kümesi etiketsizdir.

? Dil

Bu veri kümesi Türkçe yazılmış olup, gönüllülerden oluşan bir ekip tarafından topluluk katılımı yöntemleri ile oluşturulmuştur.

? Lisans

CC-BY-SA 3.0 ve GFDL

? Kaynak Veri Kümeleri

Bu veri kümesi, Türkçe Vikipedi'den oluşturulan orijinal bir veri kümesidir.

Türkçe Vikipedi veri kümesini kullandığınız için teşekkürler! Dil modelleme ve metin oluşturma görevleriniz için faydalı olmasını umuyoruz.

? Wikipedia Turkish 2023

This dataset is a collection of articles from the Turkish Wikipedia and is designed to be used for masked language modeling and text generation tasks.

? Dataset Info

Processed and cleaned using Huggingface wikipedia cleaner.

?️ Annotations

The articles in this dataset were not specifically annotated for any particular task, meaning that the dataset is unlabeled.

? Language

This dataset is written in Turkish and was created using crowdsourcing methods by a team of volunteers.

? License

CC-BY-SA 3.0 and GFDL

? Source Datasets

This dataset is an original dataset created from the Turkish Wikipedia.