UnifyID的研究人员使用神经网络生成风格化图像扰乱API识别
2018年06月25日 由 浅浅 发表
910099
0
肉眼可以相对容易地将猫的图片与迷惑人的版本连接起来,但这对于现成的计算机视觉API并非总是如此。在CVPR会议上,来自UnifyID的研究人员证明,猫科动物的风格化照片欺骗到Watson的物体识别工具概率超过97.5%。
研究人员使用了一个神经网络,Magenta是Google Brain团队开发的一个开源TensorFlow研究项目,可以生成歌曲,图像和绘图,将猫的图片转化为立体派和毕加索式的创作。
一开始,计算机视觉算法在识别不同品种,毛皮长度和颜色的猫时没有困难。当样式转换算法的插值权重设置在0(原始图像)和0.1(轻微程式化图像)之间时,机器学习算法以高置信度(97-99%)将图像分类为“猫”。但是随着研究人员开始推测插值,图片变得越来越后印象化,算法的猜测从“猫”,“猫科动物”,“食肉动物”变成了“玻璃纸”,“飞蛾”和“无脊椎动物”。
“虽然这两幅图像肉眼难以区分,但分类器为这两幅图像指定的标签结果却大不相同,”UnifyID的首席机器学习科学家Vinay Prabhu在一篇文章中写道。
IBM Watson的标签预测
在第二次更大规模的测试中,使用从Kaggle Dogs and Cats数据集中随机选择的200张猫咪图像,研究人员在通过Watson Visual Recognition API运行之前应用了样式转换。结果,算法压倒性地将猫识别为“疯狂的被子”,“迷彩”,“马赛克”和“拼凑图”。
Prabhu说:“目标不是宣布新的攻击黑匣子方法或者反对使用商业API。除了展示将样式转换视为对抗性示例生成技术的潜力之外,我们还希望引起人们关注围绕定义构成图像类别或标签的内在模糊性,以及是什么导致了图像的错误分类。”
这不是研究“对抗性干扰”或者是为了欺骗计算机视觉算法的第一个例子。2017年10月,九州大学和麻省理工学院的研究人员演示了一种改变图像中单个像素的算法,导致AI对对象进行错误分类。而在去年12月,麻省理工学院的学生成功欺骗了Google的Cloud Vision服务,将狗的图像识别为“滑雪者”。