数据集:

TigerResearch/sft_zh

语言:

zh

许可:

apache-2.0
中文

Tigerbot 开源项目中微调中文sft-zh数据合集

本合集涵盖本组织下开源的其他中文sft-中文-数据集,不需要重复下载

Usage

import datasets
ds_sft = datasets.load_dataset('TigerResearch/sft_zh')

文件细分

类型 语言 数据集文件 数量
alpaca 中文 中文 tigerbot-alpaca-zh-0.5m 0.5m
百科问答 中文 tigerbot-wiki-qa-1k 1k
名著问答 中文 tigerbot-book-qa-1k 1k
猜谜语 中文 tigerbot-riddle-qa-1k 1k
阅读理解 中文 tigerbot-superclue-c3-zh-5k 5k
问答 中文 tigerbot-hc3-zh-12k 12k
知乎问答 中文 tigerbot-zhihu-zh-10k 10k