研究人员使用计算机视觉来更好地理解和预测视错觉

2019年02月21日由深深深海发表 615127 0

视错觉图像可以欺骗人眼，这一直是引人入胜的研究课题，因为研究它们可以为人类认知和感知提供有价值的见解。澳大利亚弗林德斯大学的研究人员最近进行了一项非常有趣的研究，他们使用计算机视觉模型来预测视错觉的存在及其影响程度。

在过去的十年中，研究人员已经对人类大脑如何处理视觉刺激获得了越来越详细的生物学理解。许多现有的计算机视觉模型从我们目前对视觉处理的理解中汲取灵感。尽管如此，视觉处理的某些方面仍然没有得到充分的理解和讨论。

研究人员表示，“视觉处理始于入射光进入眼睛的视网膜感受野（RF）的感觉，视网膜神经节细胞（RGCs）是视网膜输出神经元，可转换内丛状层（IPL）的突触输入并将视觉信号传递给大脑。RGC类型的多样性以及每种特定类型的大小对偏心距（离中央凹的距离）的依赖性是视网膜视觉场景多尺度编码的生理学证据。因此，基于多尺度同时采样的视觉场景，提出了低阶的视网膜视觉计算模型。”

过去的研究已经推出了用于检测在咖啡馆墙错觉中的倾斜错觉，由背景和倾斜线索对比产生的。弗林德斯大学的研究人员推广了新方法，以涵盖更广泛的几何幻觉，以及更复杂的瓷砖错觉。

研究人员在论文中写道：“我们探索了一种简单的低水平视觉生物合理模型对几何和瓷砖错觉的反应，再现了对其几何学的误解，到目前为止，该模型尚未得到验证，无法推广到其他错觉中。”

研究人员评估了一种计算过滤模型，该模型旨在模拟视网膜神经节细胞的侧向抑制及其对不同几何错觉的反应。采用这种方法，研究人员希望能够更好地理解这些错觉，并预测它们的影响程度。

“虽然倾斜错觉中对方向的误解可能暗示了涉及皮质中方向选择性细胞的生理学解释，但我们的工作提供了一种理论的证据，即在这些模式中，由于已知的视网膜或皮质单细胞编码机制，倾斜的出现是在到达定向选择细胞之前开始的，”研究人员解释说。

总体而言，本研究中收集的结果表明，高斯差异（DoG），一种在多个尺度上检测图像边缘的滤波器可以帮助解释瓷砖错觉中的诱导倾斜，也可以帮助揭示在观看几何错觉时所感知到的一些错觉线索。此外，研究人员能够将自下而上的过程与更高层次的感知和认知联系起来，这与David Marr的视觉和边缘检测理论是一致的。

目前用于分析几何幻觉的计算机视觉模型相当复杂，因此在研究中可能更难应用。根据研究人员的研究，未来的研究应该尝试设计不太复杂和生物学上更合理的方法来检测视觉线索。

研究人员表示，“我们相信，进一步探索简单高斯模型在低级视网膜处理中的作用，以及早期DNN中的高斯核，以及对感知错觉丢失的预测将使计算机视觉技术和模型更准确，并且可能引导计算机视觉朝向或远离人类检测到的特征。反过来，这些效果可以促成更高层次的深度和运动处理模型，并推广到计算机对自然图像的理解。”

标签：

视觉识别计算机视觉

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇 Homenum Revelio !人工智能将摧毁精子捐献者的匿名性

下一篇 AI分割：从漫画中准确分离对话气泡

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

最好的基于Transformer的LLM（上）