Quicksilver:利用AI技术修复百科存在的问题
2018年08月06日 由 yuxiangyu 发表
817901
0
Miriam Adelson是一位很有成就的医生,已发表了大约一百篇关于成瘾生理学和治疗的研究论文。她还在拉斯维加斯经营一家备受瞩目的药物滥用诊所。并且,她是以色列最大的报纸的出版商,还有她的丈夫谢尔顿,是一位慈善家和有影响力的共和党捐助者(亿万富翁)。
然而,维基百科没有她的条目。
Quicksilver是旧金山创业公司Primer的软件工具,旨在帮助维基百科的编辑填补众包百科全书的盲点,Adelson是由Quicksilver标记的数千个名字之一。妇女在科学中的代表性不足是一个特殊的目标。这个全球访问量排名第五的网站一直存在性别偏见的问题:它的传记中只有18%是女性。调查估计,84%到90%的维基百科编辑是男性。
Quicksilver使用机器学习算法搜索新闻文章和科学引文,找到维基百科上遗漏的著名科学家,然后为他们写完整的草稿条目。Miriam Adelson的草稿如下:
Quicksilver已经制作了40,000个这样的摘要 - 有些较长,有些是微调维基百科遗漏的男女科学家的标准。Primer目前发布了100个样本。机器人不会自动将其输出添加到维基百科。相反,它生成的摘要旨在为维基百科编辑提供一个起点,他们可以清理错误并检查来源,防止任何算法漏洞污染网站。
在Primer领导Quicksilver工作的John Bohannon表示,为了填补该项目相当大的空白,努力维护百科的人需要一些算法帮助才能取得重大进展。“我们可以为其加速,”他说。
虽然现在这样说可能还早,但Primer的软件已经开始产生影响。伦敦帝国理工学院的物理学家杰西卡·韦德(Jessica Wade)预览了Bohannon的Quicksilver。她被提示为Facebook蒙特利尔人工智能实验室的负责人JoëllePineau写了一个条目,Quicksilver指出该网站缺少该条目。“维基百科有极大的偏见,女性在科学领域的不足表现尤其糟糕,”韦德说,在过去的一年里,他亲自为该网站增加了近300名女科学家。“使用Quicksilver,你不必四处寻找漏掉的名字,而且你可以很快获得大量的良好的信息。”
Quicksilver还可以帮助编辑保持现有的维基百科文章为最新。今年春天,美国自然历史博物馆(American Museum of Natural History)举办了一场旨在提高女性科学家参赛作品的“edit-a-thon”活动。Quicksilver提供了维基百科上收集到的关于女性科学家的资料,其中包括维基百科上关于这些资料的链接。组织这次活动的博物馆研究员玛丽亚·斯特拉斯(Maria Strangas)说:“它在两个小时内帮助25位第一次担任编辑的女性科学家更新了大约70位女性科学家的页面。放大了事件对维基百科的影响。”
Quicksilver由Primer使用的工具和数据衍生而来,为包括美国情报机构和大型金融公司在内的客户服务。该创业公司提供的软件可以提取内部或外部数据,比如新闻提要或内部文档,生成图形或书面报告。
在去年的一次会议上,Bohannon遇到了Wade和其他试图改善维基百科上女性形象的人,并开始思索算法是否能提供帮助。于是,Quicksilver项目诞生了。后来他接受了维基媒体基金会的建议(该基金会是托管维基百科的非营利组织)。
第一步是收集30,000篇关于科学家的维基百科文章,训练算法以检测新闻文章中与在网站上有条目的研究人员相关的标志。Quicksilver利用这些知识,通过交叉引用现有的维基百科条目,从一个名为Semantic Scholar的学术搜索引擎中列出的20万名科学作者的名单,来找到明显的遗漏名字。该软件提供了从5亿条新闻文章的集合中编写缺失条目所需的事实,并将它们提供给经过训练的系统,从过去的例子中生成传记条目。
Quicksilver远非第一次尝试使用机器完善维基百科。例如,机器已经可以自动修复拼写错误或故意破坏。
Primer正在努力使Quicksilver多语言,最初扩展到俄语和中文,并扩展到其他主题,如政治家等。但并不打算让Quicksilver进行自动添加。