数据集:
musabg/wikipedia-tr
Bu veri kümesi, Türkçe Vikipedi'den alınan makalelerin bir derlemesi olup, maskeleme dil modelleme ve metin oluşturma görevleri için tasarlanmıştır.
Bu veri kümesindeki makaleler, özellikle belirli bir görev için etiketlenmemiş olup, veri kümesi etiketsizdir.
Bu veri kümesi Türkçe yazılmış olup, gönüllülerden oluşan bir ekip tarafından topluluk katılımı yöntemleri ile oluşturulmuştur.
CC-BY-SA 3.0 ve GFDL
Bu veri kümesi, Türkçe Vikipedi'den oluşturulan orijinal bir veri kümesidir.
Türkçe Vikipedi veri kümesini kullandığınız için teşekkürler! Dil modelleme ve metin oluşturma görevleriniz için faydalı olmasını umuyoruz.
This dataset is a collection of articles from the Turkish Wikipedia and is designed to be used for masked language modeling and text generation tasks.
Processed and cleaned using Huggingface wikipedia cleaner.
The articles in this dataset were not specifically annotated for any particular task, meaning that the dataset is unlabeled.
This dataset is written in Turkish and was created using crowdsourcing methods by a team of volunteers.
CC-BY-SA 3.0 and GFDL
This dataset is an original dataset created from the Turkish Wikipedia.