在 SantaCoder Space Demo 上玩耍模型。
这个模型与 SantaCoder 相同,但可以使用transformers >= 4.28.1加载以使用GPTBigCode架构。关于此模型的全部文档,请参阅 SantaCoder model page 。
模型有两个版本(分支):
该模型是在GitHub代码上进行训练的。因此,它不是一个指令模型,诸如“编写一个计算平方根的函数”的命令效果不好。您应该用源代码中出现的方式来表达命令,例如评论(例如#以下函数计算sqrt)或编写函数签名和文档字符串,然后让模型完成函数主体。
模型的预训练数据集已根据宽松的许可证进行了过滤。尽管如此,该模型可以直接从数据集生成源代码。代码的许可证可能需要归属及/或其他特定要求,必须予以尊重。我们提供了一个 search index ,让您可以搜索预训练数据并确定生成的代码来自于何处,并为您的代码应用适当的归属。
该模型是使用Python、Java和JavaScript的源代码进行训练的。源代码中的主要语言是英语,尽管还存在其他语言。因此,该模型能够根据一定的上下文生成代码片段,但不能保证生成的代码能够正常工作。它可能是低效的,包含错误或漏洞。
该模型使用的是CodeML Open RAIL-M v0.1许可证。您可以在 here 找到完整的许可证。