模型:
facebook/wav2vec2-base-100k-voxpopuli
在 VoxPopuli corpus 的 100k 无标签数据子集上预训练的基础模型 Facebook's Wav2Vec2 。
注意:此模型没有分词器,因为它仅在音频上进行了预训练。要使用此模型进行语音识别,需要创建一个分词器,并在带标签的文本数据上对模型进行微调。查看 this blog 以获取有关如何微调模型的更详细说明。
作者:Facebook AI 的 Changhan Wang、Morgane Riviere、Ann Lee、Anne Wu、Chaitanya Talnikar、Daniel Haziza、Mary Williamson、Juan Pino、Emmanuel Dupoux
有关更多信息,请访问官方网站 here
请参阅 this blog 以了解如何在特定语言上微调此模型。请注意,要进行微调,应将 "facebook/wav2vec2-large-xlsr-53" 替换为此检查点。