英文

更新于 2023.06.01

  • 添加了 Safetensor 分片模型权重(最大分片为 1GB)

KoAlpaca-Polyglot-12.8B (v1.1b)

此模型是基于 KoAlpaca 数据集 v1.1b 上的 EleutherAI/polyglot-ko-12.8b 进行微调得到的版本

详细代码可在 KoAlpaca Github Repository 中找到

训练过程

训练超参数

训练中使用了以下超参数:

  • 学习率:5e-05
  • 训练批大小:1
  • 随机种子:42
  • 分布式类型:多 GPU(A100 80G)
  • 设备数:4
  • 梯度积累步数:64
  • 总训练批大小:256
  • 总评估批大小:32
  • 优化器:带有 betas=(0.9,0.999) 和 epsilon=1e-08 的 Adam
  • 学习率调度器类型:linear
  • 训练轮数:2.0

框架版本

  • Transformers 4.28.1
  • Pytorch 2.0.0+cu117
  • Datasets 2.11.0
  • Tokenizers 0.13.3