模型:

j-hartmann/emotion-english-distilroberta-base

英文

Emotion English DistilRoBERTa-base

描述ℹ

使用该模型,您可以对英文文本数据进行情绪分类。该模型是在6个多样化的数据集上进行训练的(请参见下面的附录),并预测了埃克曼的6种基本情绪,还有一个中性类:

  • 愤怒?
  • 厌恶?
  • 恐惧?
  • 喜悦?
  • 中性?
  • 悲伤?
  • 惊讶?
  • 该模型是 DistilRoBERTa-base 的微调检查点。有关“非蒸馏”情绪模型,请参考 RoBERTa-large 版本的模型卡。

    应用程序?

    在Google Colab上使用Hugging Face的管道命令,在单个文本示例上使用3行代码运行情绪模型:

    from transformers import pipeline
    classifier = pipeline("text-classification", model="j-hartmann/emotion-english-distilroberta-base", return_all_scores=True)
    classifier("I love this!")
    
    Output:
    [[{'label': 'anger', 'score': 0.004419783595949411},
      {'label': 'disgust', 'score': 0.0016119900392368436},
      {'label': 'fear', 'score': 0.0004138521908316761},
      {'label': 'joy', 'score': 0.9771687984466553},
      {'label': 'neutral', 'score': 0.005764586851000786},
      {'label': 'sadness', 'score': 0.002092392183840275},
      {'label': 'surprise', 'score': 0.008528684265911579}]]
    

    在Google Colab上对多个示例和完整数据集(例如.csv文件)运行情绪模型:

    联系方式?

    如果您有任何问题或反馈,请通过jochen.hartmann@tum.de与我们联系。

    感谢Samuel Domdey和 chrsiebert 在使该模型可用方面的支持。

    参考✅

    如果您使用此模型,请引用以下参考文献。即将推出工作论文。

    Jochen Hartmann, "Emotion English DistilRoBERTa-base". https://huggingface.co/j-hartmann/emotion-english-distilroberta-base/, 2022.
    

    BibTex引用:

    @misc{hartmann2022emotionenglish,
      author={Hartmann, Jochen},
      title={Emotion English DistilRoBERTa-base},
      year={2022},
      howpublished = {\url{https://huggingface.co/j-hartmann/emotion-english-distilroberta-base/}},
    }
    

    附录?

    请在下面找到用于训练的数据集概述。所有数据集都包含英文文本。该表总结了每个数据集中可用的情绪。这些数据集包含来自Twitter、Reddit、学生自我报告和电视对话的语句的情绪标签。由于MELD(多模态情绪线数据集)扩展了流行的情绪线数据集,因此情绪线本身不包含在此处。

    Name anger disgust fear joy neutral sadness surprise
    Crowdflower (2016) Yes - - Yes Yes Yes Yes
    Emotion Dataset, Elvis et al. (2018) Yes - Yes Yes - Yes Yes
    GoEmotions, Demszky et al. (2020) Yes Yes Yes Yes Yes Yes Yes
    ISEAR, Vikash (2018) Yes Yes Yes Yes - Yes -
    MELD, Poria et al. (2019) Yes Yes Yes Yes Yes Yes Yes
    SemEval-2018, EI-reg, Mohammad et al. (2018) Yes - Yes Yes - Yes -

    该模型在上述列出的数据集的平衡子集上进行训练(每种情绪2,811个观测值,即总共接近20,000个观测值)。此平衡子集的80%用于训练,20%用于评估。评估准确性为66%(比随机基准的1/7=14%要高)。

    科学应用?

    下面是使用“Emotion English DistilRoBERTa-base”模型的论文列表。如果您希望将您的论文添加到列表中,请发送电子邮件给我。

    • Butt, S., Sharma, S., Sharma, R., Sidorov, G., & Gelbukh, A. (2022). What goes on inside rumour and non-rumour tweets and their reactions: A Psycholinguistic Analyses. Computers in Human Behavior, 107345.
    • Kuang, Z., Zong, S., Zhang, J., Chen, J., & Liu, H. (2022). Music-to-Text Synaesthesia: Generating Descriptive Text from Music Recordings. arXiv preprint arXiv:2210.00434.
    • Rozado, D., Hughes, R., & Halberstadt, J. (2022). Longitudinal analysis of sentiment and emotion in news media headlines using automated labeling with Transformer language models. Plos one, 17(10), e0276367.