模型:

facebook/wav2vec2-base-100k-voxpopuli

英文

Wav2Vec2-Base-VoxPopuli

VoxPopuli corpus 的 100k 无标签数据子集上预训练的基础模型 Facebook's Wav2Vec2

注意:此模型没有分词器,因为它仅在音频上进行了预训练。要使用此模型进行语音识别,需要创建一个分词器,并在带标签的文本数据上对模型进行微调。查看 this blog 以获取有关如何微调模型的更详细说明。

论文: VoxPopuli: A Large-Scale Multilingual Speech Corpus for Representation Learning, Semi-Supervised Learning and Interpretation

作者:Facebook AI 的 Changhan Wang、Morgane Riviere、Ann Lee、Anne Wu、Chaitanya Talnikar、Daniel Haziza、Mary Williamson、Juan Pino、Emmanuel Dupoux

有关更多信息,请访问官方网站 here

微调

请参阅 this blog 以了解如何在特定语言上微调此模型。请注意,要进行微调,应将 "facebook/wav2vec2-large-xlsr-53" 替换为此检查点。