模型:

facebook/dpr-ctx_encoder-single-nq-base

类库:

PyTorch TensorFlow Transformers

数据集:

nq_open 3Anq_open

语言:

其他:

dpr

预印本库:

arxiv:2004.04906 arxiv:1702.08734 arxiv:1910.09700

许可:

cc-by-nc-4.0

模型介绍文件清单

英文

dpr-ctx_encoder-single-nq-base

模型详情

模型描述： Dense Passage Retrieval (DPR) 是用于最先进开放领域问答研究的一组工具和模型。dpr-ctx_encoder-single-nq-base 是使用 Natural Questions (NQ) dataset （ Lee et al., 2019 ； Kwiatkowski et al., 2019 ）训练的上下文编码器。

开发者：请参阅模型开发者的 GitHub repo
模型类型：基于BERT的编码器
语言： CC-BY-NC-4.0 ，还请参阅 Code of Conduct
许可证：英语
相关模型：
获取更多信息的资源：

如何开始使用该模型

使用以下代码开始使用该模型。

>>> from transformers import DPRContextEncoder, DPRContextEncoderTokenizer
>>> tokenizer = DPRContextEncoderTokenizer.from_pretrained("facebook/dpr-ctx_encoder-single-nq-base")
>>> model = DPRContextEncoder.from_pretrained("facebook/dpr-ctx_encoder-single-nq-base")
>>> input_ids = tokenizer("Hello, is my dog cute ?", return_tensors="pt")["input_ids"]
>>> embeddings = model(input_ids).pooler_output

使用情况

直接使用

dpr-ctx_encoder-single-nq-base、 dpr-question-encoder-single-nq-base 和 dpr-reader-single-nq-base 可用于开放领域问答任务。

滥用和超出范围的使用

该模型不应被用于故意创建对人们具有敌意或疏远感的环境。此外，DPR模型集不是被训练成人或事件的事实或真实表达，因此使用模型生成此类内容超出了该模型的能力范围。

风险、限制和偏见

内容警告：读者应意识到本节可能包含令人不安、冒犯的内容，可能会传播历史和当前的刻板印象。

这个模型的偏见和公平性问题已经进行了重要研究（参见例如 Sheng et al. (2021) 和 Bender et al. (2021) ）。模型生成的预测可能包含对受保护类别、身份特征以及敏感社会和职业群体的令人不安和有害的刻板印象。

训练

训练数据

该模型是使用 Natural Questions (NQ) dataset （ Lee et al., 2019 ； Kwiatkowski et al., 2019 ）进行训练的。模型作者写道：

该数据集旨在进行端到端问答。问题源自真实的Google搜索查询，并且答案是由标注员在维基百科文章中确定的片段。

训练过程

训练过程在 associated paper 中描述：

给定 M 个文本段落的集合，我们密集的段落检索器（DPR）的目标是将所有段落映射到一个低维连续空间，以便在运行时能够高效地检索与输入问题相关的前 k 个段落供读者使用。

我们的密集的段落检索器（DPR）使用一个将任何文本段落映射到 d 维实数向量的密集编码器 EP(·) 来构建所有 M 个段落的索引，我们将在检索时使用。在运行时，DPR应用不同的编码器 EQ(·)，将输入问题映射到一个 d 维向量，并检索向量与问题向量最接近的 k 个段落。

作者报告称，对于编码器，他们使用了两个独立的BERT（ Devlin et al., 2019 ）网络（base，uncased），并在推理时使用FAISS（ Johnson et al., 2017 ）对段落进行编码和索引。有关训练的更多详细信息，请参阅论文，包括编码器、推理、正面和负面段落以及批次内的负面影响。

评估

以下评估信息摘自 associated paper 。

测试数据、因素和指标

模型开发者报告了该模型在五个问答数据集上的性能，使用 top-k 准确性（k ∈ {20, 100}）作为指标。这些数据集分别是 NQ 、 TriviaQA 、 WebQuestions (WQ) 、 CuratedTREC (TREC) 和 SQuAD v1.1 。

结果

Top 20	Top 100
NQ	TriviaQA	WQ	TREC	SQuAD	NQ	TriviaQA	WQ	TREC	SQuAD
78.4	79.4	73.2	79.8	63.2	85.4	85.0	81.4	89.1	77.2

环境影响

可以使用 Machine Learning Impact calculator 中提出的 Lacoste et al. (2019) 估算碳排放。我们提供硬件类型，并基于 associated paper 进行估算。

硬件类型：8个32GB的GPU
使用小时数：未知
云服务提供商：未知
计算区域：未知
排放的碳量：未知

技术规格

有关建模架构、目标、计算基础设施和训练细节，请参阅 associated paper 。

引用信息

  @inproceedings{karpukhin-etal-2020-dense,
    title = "Dense Passage Retrieval for Open-Domain Question Answering",
    author = "Karpukhin, Vladimir and Oguz, Barlas and Min, Sewon and Lewis, Patrick and Wu, Ledell and Edunov, Sergey and Chen, Danqi and Yih, Wen-tau",
    booktitle = "Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing (EMNLP)",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://www.aclweb.org/anthology/2020.emnlp-main.550",
    doi = "10.18653/v1/2020.emnlp-main.550",
    pages = "6769--6781",
}

模型卡作者

本模型卡是由Hugging Face团队撰写的。

作者:

Meta AI

数据集大小:

836.27 MB