什么是AI偏见?
2019年10月05日 由 sunlei 发表
39298
0
人工智能的偏见问题始于定义,但并没有结束。“偏见”是一个过载的术语,在不同的语境中意味着截然不同的东西。
下面是一些偏见的定义,供你仔细阅读。
在统计学中:偏差是估计量的期望值与其估计量之间的差。这太专业了,请允许我翻译一下。偏差是指系统地偏离目标的结果。例如射箭,你朝向错的地方射箭,高偏差并不意味着你射的是所有的地方(这是高方差),但可能会导致一个射手完美的击中靶心下面的位置。在这个用法中,这个词没有什么情感内涵。
-在数据收集(还有统计学)中:当你摸索数据收集的时候,你的样本不能代表你感兴趣的总体。“抽样偏差”是这里的正式名称。这种偏见意味着你不能相信你的统计结果。
- 认知心理学:对理性的系统性偏离。在这个精练的定义中,除了“from”之外的每个单词都带有字段特定的细微差别。翻译成外行人的术语?令人惊讶的是,你的大脑进化出了一些对事物的反应方式,心理学家最初发现这些反应令人惊讶。分类的认知偏见清单令人瞠目结舌。
-在神经网络算法中:本质上是一个截距项。(偏见听起来比高中数学单词更酷,对吧?)
-在社会和物理科学中:一系列现象中的任何一种,涉及过去的/不相关的条件对现在的决定的过度影响。例如
文化偏见和
基础设施偏见。
-在电子学中:用
交流信号施加在电路中的固定直流电压或电流。
-地理:
西弗吉尼亚州的一个地方。(我听说法国人也有一些偏见。)
-在神话学中:
这些古希腊人中的任何一个。
-大多数
人工智能专家想到的一个问题是:当一个计算机系统反映出创造它的人的隐含
价值时,就会产生算法偏见。(人类创造的一切不都是隐含价值的反映吗?)
-大多数人想到的是:我们过去的经历扭曲了我们对信息的感知和反应,特别是在不公平对待他人和其他普遍的不良行为的情况下。有些人用这个词来形容
偏见。
哦,天哪。这里有很多意思,有些比其他的更刺激。
ML/AI在说哪一个?
ML/AI这个年轻的学科有一个习惯,那就是从任何地方借用术语(有时似乎没有查到原始含义),所以当人们谈论AI中的偏见时,他们可能指的是上面几种定义中的任何一种。想象一下,当你准备好面对一篇华丽的论文,承诺要纠正人工智能中的偏见时,却发现(几页纸之后)他们所谈论的偏见是统计上的偏见。
不过,最时髦的话题是能引起媒体关注的话题。血腥的人类。唉,当我们阅读(和写作)这些话题时,我们甚至会带着各种偏见(扭曲我们对信息的感知和反应的过去经历)。
人工智能的全部意义是让你用例子(数据!)而不是指示。至于哪些例子?嘿,给你当老师的权利。数据集就像教科书一样供学生学习。你猜怎么着?教科书有人类作者,数据集也有。
教科书反映了作者的偏见。和教科书一样,数据集也有作者。它们是按照人们的指示收集的。
想象一下,试着从一个有偏见的作者写的教科书中教一个人类学生——如果这个学生最终反映出一些同样的扭曲的看法,你会感到惊讶吗?
那是谁的错?
人工智能的神奇之处在于它没有人类的偏见。如果它有自己的人格和观点,它可能会勇敢地面对那些向它灌输偏见的人。相反,
ML/AI算法只是用于继续显示模式的工具。向他们展示不好的模式,他们就会附和。最后两点的偏见不是来自ML/AI算法,而是来自人。
偏见不是来自人工智能算法,而是来自人。
算法从不独立思考。事实上,它们根本不思考(它们是工具),所以由我们人类来为它们思考。如果你想知道你能对AI偏见做些什么,并深入这个兔子洞,这里是
入口。
原文链接:https://towardsdatascience.com/what-is-ai-bias-6606a3bcb814