模型:
TheBloke/vicuna-13B-1.1-HF
许可:
other注意:新版本可用,请查看较新版本的权重 here 。如果仍要使用此旧版本,请查看不同版本之间的兼容性和差异 here 。
Vicuna是一个聊天助手,通过在用户共享的来自ShareGPT的对话上进行细调LLaMA训练而成。
Vicuna的主要用途是用于大型语言模型和聊天机器人的研究。模型的主要预期用户是自然语言处理、机器学习和人工智能领域的研究人员和爱好者。
命令行界面: https://github.com/lm-sys/FastChat#vicuna-weights 。API(OpenAI API,Huggingface API): https://github.com/lm-sys/FastChat/tree/main#api 。
Vicuna v1.1是通过有监督指导微调从LLaMA微调而来的。训练数据约为70K个在ShareGPT.com上收集的对话。有关更多详细信息,请参阅附录中的“Vicuna模型的训练详情”章节 paper 。
Vicuna经过标准基准测试、人类偏好和LLM作为评委进行评估。有关更多详细信息,请参阅这份 paper 和 leaderboard 。
请参见 vicuna_weights_version.md 。
特别感谢 @TheBloke 托管此早期合并版本的权重。