卡内基梅隆大学的研究人员提出,人工智能可以在网上发表正面评论
2020年01月14日 由 TGS 发表
852208
0
近日,卡耐基梅隆大学语言技术研究所的研究人员表示,他们已经开发出一种利用机器学习分析网上评论的系统,可以挑选出那些捍卫或同情被剥夺公民权的人的评论。虽然还没有商业化,但他们已经用它来做实验,在YouTube上搜索了近100万条评论,重点关注罗兴亚难民危机和2019年2月克什米尔发生的普尔瓦马(Pulwama)恐怖袭击事件。他们希望这能成为未来系统的基础,减少在出版商网站、社交媒体和其他地方编辑评论所需要的手工工作。
打击网络暴力行为并非易事。Anti-Defamation League是一个追踪并打击反犹太主义的非营利组织,在该组织进行的一项调查中,超过五分之一的受访者表示曾受到网络暴力。近五分之一的人表示他们经历过骚扰或跟踪,超过20%的人认为,骚扰是由他们的性别认同、种族、民族、性取向、宗教、职业或残疾造成的。
人工智能语言模型从许多例子中学习,以预测给定句子中可能出现的单词,使得分析大量文本成为可能。该研究贡献了一种技术,使模型能够消化来自南亚的短文本——这些文本可能很难解释,因为它们往往包含拼写错误和语法错误,并结合了各异的语言和写作知识。
具体来说就是研究人员获得了单词的数字表示,揭示了新的语言分组或集群。语言模型创建了这些后,具有相似含义的单词就可以用相同的方式表示,使得计算评论或帖子中某个单词与其他单词的接近度更好。该团队报告说,在实验中,他们的方法与商业上可用的解决方案效果相同,甚至更好。对YouTube上评论的随机抽样显示,大约10%的评论是正面的,而人工智能算法的结果是88%。
此前,Jigsaw发布了一组数据,其中包含了数十万条带有攻击性和身份标签的评论以及注释。对此,卡内基梅隆大学博士后Ashiqur R. KhudaBukhsh表示:“即使是像这样的、充满仇恨的内容,我们仍然可以从中找到积极的评论,找到黑暗中的人性光辉。”