数据集:

TigerResearch/dev_pretrain

语言:

zh

大小:

n<1K

许可:

apache-2.0
中文

Dataset Card for "dev_pretrain"

Tigerbot模型 develop pretrain数据。

train_clm.py 中被使用。

Usage

import datasets

ds_sft = datasets.load_dataset('TigerResearch/dev_pretrain')

Field

  • content: 语料