数据集:

musabg/wikipedia-tr

中文

📖 Türkçe Vikipedi Mayıs 2023

Bu veri kümesi, Türkçe Vikipedi'den alınan makalelerin bir derlemesi olup, maskeleme dil modelleme ve metin oluşturma görevleri için tasarlanmıştır.

🗣️ Etiketlemeler

Bu veri kümesindeki makaleler, özellikle belirli bir görev için etiketlenmemiş olup, veri kümesi etiketsizdir.

🌐 Dil

Bu veri kümesi Türkçe yazılmış olup, gönüllülerden oluşan bir ekip tarafından topluluk katılımı yöntemleri ile oluşturulmuştur.

📜 Lisans

CC-BY-SA 3.0 ve GFDL

💻 Kaynak Veri Kümeleri

Bu veri kümesi, Türkçe Vikipedi'den oluşturulan orijinal bir veri kümesidir.

Türkçe Vikipedi veri kümesini kullandığınız için teşekkürler! Dil modelleme ve metin oluşturma görevleriniz için faydalı olmasını umuyoruz.

📖 Wikipedia Turkish 2023

This dataset is a collection of articles from the Turkish Wikipedia and is designed to be used for masked language modeling and text generation tasks.

📚 Dataset Info

Processed and cleaned using Huggingface wikipedia cleaner.

🗣️ Annotations

The articles in this dataset were not specifically annotated for any particular task, meaning that the dataset is unlabeled.

🌐 Language

This dataset is written in Turkish and was created using crowdsourcing methods by a team of volunteers.

📜 License

CC-BY-SA 3.0 and GFDL

💻 Source Datasets

This dataset is an original dataset created from the Turkish Wikipedia.