数据集:
TigerResearch/sft_zh
语言:
zh许可:
apache-2.0Tigerbot 开源项目中微调中文sft-zh数据合集
本合集涵盖本组织下开源的其他中文sft-中文-数据集,不需要重复下载
import datasets ds_sft = datasets.load_dataset('TigerResearch/sft_zh')
类型 | 语言 | 数据集文件 | 数量 |
---|---|---|---|
alpaca 中文 | 中文 | tigerbot-alpaca-zh-0.5m | 0.5m |
百科问答 | 中文 | tigerbot-wiki-qa-1k | 1k |
名著问答 | 中文 | tigerbot-book-qa-1k | 1k |
猜谜语 | 中文 | tigerbot-riddle-qa-1k | 1k |
阅读理解 | 中文 | tigerbot-superclue-c3-zh-5k | 5k |
问答 | 中文 | tigerbot-hc3-zh-12k | 12k |
知乎问答 | 中文 | tigerbot-zhihu-zh-10k | 10k |