更新于 2023.06.01
- 添加了 Safetensor 分片模型权重(最大分片为 1GB)
KoAlpaca-Polyglot-12.8B (v1.1b)
此模型是基于 KoAlpaca 数据集 v1.1b 上的
EleutherAI/polyglot-ko-12.8b
进行微调得到的版本
详细代码可在
KoAlpaca Github Repository
中找到
训练过程
训练超参数
训练中使用了以下超参数:
- 学习率:5e-05
- 训练批大小:1
- 随机种子:42
- 分布式类型:多 GPU(A100 80G)
- 设备数:4
- 梯度积累步数:64
- 总训练批大小:256
- 总评估批大小:32
- 优化器:带有 betas=(0.9,0.999) 和 epsilon=1e-08 的 Adam
- 学习率调度器类型:linear
- 训练轮数:2.0
框架版本
- Transformers 4.28.1
- Pytorch 2.0.0+cu117
- Datasets 2.11.0
- Tokenizers 0.13.3