Facebook的安全主管谈论如何用机器学习保证用户数据安全
2018年08月22日 由 浅浅 发表
250292
0
机器学习越来越多地用于改善组织的安全状况,但机器学习模型仍然难以识别上下文。Facebook的安全主管Aanchal Gupta表示,Facebook不仅要实现机器学习,还要破译推进技术的方法,更好地理解这种情况。
在访谈的第三部分中,Gupta描述了Facebook如何实施机器学习以标记不适当的内容和帐户,包括检测到无法识别的登录。
Q:Facebook如何在安全方面实现机器学习?
Aanchal Gupta:我们最近使用机器学习关闭与金融骗局有关的50多万个账户。再举一个例子,我们还有一些名为登录警报的东西,我们向你发送有关无法识别登录的警报。我们要做的是,看你之前的登录尝试,这样我们就有了模式匹配。如果我们看到,这个用户总是来自加利福尼亚,她通常在太平洋标准时间晚上9点登录,这些是她登录的IP地址,然后当我们看到同一个用户从另一个国家或地区登录并且非常怪异的时候,比如他们最初的登录来自加利福尼亚,然后两小时后来自中国。他们不可能用两个小时就从加利福尼亚飞到中国。这就是机器学习帮助我们识别这些异常情况的地方,我们可以通知用户,似乎有一些针对你的帐户的不当登录尝试。
Q:对于安全性,如何用机器学习帮助识别你要标记的内容?
Aanchal Gupta:为了保证我们的平台对我们的用户安全,我们必须使用机器学习来识别不适当的内容,然后快速删除它,以便我们的用户有一个非常安全的平台来使用和连接其他用户。
机器学习的方式是基本上模式识别。你必须训练机器学习模型以进行模式识别。例如,我在谈论一个非常基本的,一个基线的例子,如果你正在尝试识别语言滥用,你会给你的机器学习模型一个列表。这就是你开始训练机器学习模型的方法。随着机器学习算法的运行,它将开始识别这些模式,它会说,是的,这些都是我们应该识别的词。
然后我们将那些用于人工审核的内容发送给我们的团队,以便更加确定,因为有时机器学习很难获得上下文。我们正在进一步投资如何使机器学习也可以开始理解上下文。