使用该模型,您可以对英文文本数据进行情绪分类。该模型是在6个多样化的数据集上进行训练的(请参见下面的附录),并预测了埃克曼的6种基本情绪,还有一个中性类:
该模型是 DistilRoBERTa-base 的微调检查点。有关“非蒸馏”情绪模型,请参考 RoBERTa-large 版本的模型卡。
在Google Colab上使用Hugging Face的管道命令,在单个文本示例上使用3行代码运行情绪模型:
from transformers import pipeline classifier = pipeline("text-classification", model="j-hartmann/emotion-english-distilroberta-base", return_all_scores=True) classifier("I love this!")
Output: [[{'label': 'anger', 'score': 0.004419783595949411}, {'label': 'disgust', 'score': 0.0016119900392368436}, {'label': 'fear', 'score': 0.0004138521908316761}, {'label': 'joy', 'score': 0.9771687984466553}, {'label': 'neutral', 'score': 0.005764586851000786}, {'label': 'sadness', 'score': 0.002092392183840275}, {'label': 'surprise', 'score': 0.008528684265911579}]]
在Google Colab上对多个示例和完整数据集(例如.csv文件)运行情绪模型:
如果您有任何问题或反馈,请通过jochen.hartmann@tum.de与我们联系。
感谢Samuel Domdey和 chrsiebert 在使该模型可用方面的支持。
如果您使用此模型,请引用以下参考文献。即将推出工作论文。
Jochen Hartmann, "Emotion English DistilRoBERTa-base". https://huggingface.co/j-hartmann/emotion-english-distilroberta-base/, 2022.
BibTex引用:
@misc{hartmann2022emotionenglish, author={Hartmann, Jochen}, title={Emotion English DistilRoBERTa-base}, year={2022}, howpublished = {\url{https://huggingface.co/j-hartmann/emotion-english-distilroberta-base/}}, }
请在下面找到用于训练的数据集概述。所有数据集都包含英文文本。该表总结了每个数据集中可用的情绪。这些数据集包含来自Twitter、Reddit、学生自我报告和电视对话的语句的情绪标签。由于MELD(多模态情绪线数据集)扩展了流行的情绪线数据集,因此情绪线本身不包含在此处。
Name | anger | disgust | fear | joy | neutral | sadness | surprise |
---|---|---|---|---|---|---|---|
Crowdflower (2016) | Yes | - | - | Yes | Yes | Yes | Yes |
Emotion Dataset, Elvis et al. (2018) | Yes | - | Yes | Yes | - | Yes | Yes |
GoEmotions, Demszky et al. (2020) | Yes | Yes | Yes | Yes | Yes | Yes | Yes |
ISEAR, Vikash (2018) | Yes | Yes | Yes | Yes | - | Yes | - |
MELD, Poria et al. (2019) | Yes | Yes | Yes | Yes | Yes | Yes | Yes |
SemEval-2018, EI-reg, Mohammad et al. (2018) | Yes | - | Yes | Yes | - | Yes | - |
该模型在上述列出的数据集的平衡子集上进行训练(每种情绪2,811个观测值,即总共接近20,000个观测值)。此平衡子集的80%用于训练,20%用于评估。评估准确性为66%(比随机基准的1/7=14%要高)。
下面是使用“Emotion English DistilRoBERTa-base”模型的论文列表。如果您希望将您的论文添加到列表中,请发送电子邮件给我。