什么是AI偏见？

2019年10月05日由 sunlei 发表 39393 0

人工智能的偏见问题始于定义，但并没有结束。“偏见”是一个过载的术语，在不同的语境中意味着截然不同的东西。

下面是一些偏见的定义，供你仔细阅读。

在统计学中:偏差是估计量的期望值与其估计量之间的差。这太专业了，请允许我翻译一下。偏差是指系统地偏离目标的结果。例如射箭，你朝向错的地方射箭，高偏差并不意味着你射的是所有的地方(这是高方差)，但可能会导致一个射手完美的击中靶心下面的位置。在这个用法中，这个词没有什么情感内涵。

-在数据收集（还有统计学）中：当你摸索数据收集的时候，你的样本不能代表你感兴趣的总体。“抽样偏差”是这里的正式名称。这种偏见意味着你不能相信你的统计结果。

- 认知心理学:对理性的系统性偏离。在这个精练的定义中，除了“from”之外的每个单词都带有字段特定的细微差别。翻译成外行人的术语?令人惊讶的是，你的大脑进化出了一些对事物的反应方式，心理学家最初发现这些反应令人惊讶。分类的认知偏见清单令人瞠目结舌。

-在神经网络算法中：本质上是一个截距项。（偏见听起来比高中数学单词更酷，对吧？）

-在社会和物理科学中：一系列现象中的任何一种，涉及过去的/不相关的条件对现在的决定的过度影响。例如文化偏见和基础设施偏见。

-在电子学中：用交流信号施加在电路中的固定直流电压或电流。

-地理：西弗吉尼亚州的一个地方。（我听说法国人也有一些偏见。）

-在神话学中:这些古希腊人中的任何一个。

-大多数人工智能专家想到的一个问题是:当一个计算机系统反映出创造它的人的隐含价值时，就会产生算法偏见。(人类创造的一切不都是隐含价值的反映吗?)

-大多数人想到的是:我们过去的经历扭曲了我们对信息的感知和反应，特别是在不公平对待他人和其他普遍的不良行为的情况下。有些人用这个词来形容偏见。

哦，天哪。这里有很多意思，有些比其他的更刺激。

ML/AI在说哪一个？

ML/AI这个年轻的学科有一个习惯，那就是从任何地方借用术语(有时似乎没有查到原始含义)，所以当人们谈论AI中的偏见时，他们可能指的是上面几种定义中的任何一种。想象一下，当你准备好面对一篇华丽的论文，承诺要纠正人工智能中的偏见时，却发现(几页纸之后)他们所谈论的偏见是统计上的偏见。

不过，最时髦的话题是能引起媒体关注的话题。血腥的人类。唉，当我们阅读(和写作)这些话题时，我们甚至会带着各种偏见(扭曲我们对信息的感知和反应的过去经历)。

人工智能的全部意义是让你用例子（数据！）而不是指示。至于哪些例子？嘿，给你当老师的权利。数据集就像教科书一样供学生学习。你猜怎么着？教科书有人类作者，数据集也有。

教科书反映了作者的偏见。和教科书一样，数据集也有作者。它们是按照人们的指示收集的。

想象一下，试着从一个有偏见的作者写的教科书中教一个人类学生——如果这个学生最终反映出一些同样的扭曲的看法，你会感到惊讶吗？那是谁的错？

人工智能的神奇之处在于它没有人类的偏见。如果它有自己的人格和观点，它可能会勇敢地面对那些向它灌输偏见的人。相反，ML/AI算法只是用于继续显示模式的工具。向他们展示不好的模式，他们就会附和。最后两点的偏见不是来自ML/AI算法，而是来自人。

偏见不是来自人工智能算法，而是来自人。

算法从不独立思考。事实上，它们根本不思考(它们是工具)，所以由我们人类来为它们思考。如果你想知道你能对AI偏见做些什么，并深入这个兔子洞，这里是入口。

原文链接：https://towardsdatascience.com/what-is-ai-bias-6606a3bcb814

标签：

学习 AI

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇图解十大CNN架构（下）

下一篇用AI生成霉霉（Taylor Swift）的歌词（下）

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

最好的基于Transformer的LLM（上）