数据集:

tiansz/ChineseSTS

语言:

zh

大小:

1M<n<10M

其他:

STS

许可:

apache-2.0
中文

这是一个中文文本相似度的数据集,相似度划分为 0、1。

notebook 记录了我使用本数据集的全过程。同时你也可以在 github 上下载该数据集