新的AI成像工具允许对2D图片进行交互式3D操作
2023年05月26日 由 daydream 发表
884562
0
来自马克斯·普朗克信息学研究所、麻省理工学院、谷歌和宾夕法尼亚大学的计算机科学家团队开发了一种新的人工智能成像工具,用于对照片中描绘的2D图像进行用户交互式3D操作。该团队在arXiv预印本服务器上发表了一篇描述新工具DragGAN的论文,以及描述该工具功能的短视频。
Photoshop最早发布于20世纪80年代末,从那时起,它和类似的应用程序就被用于编辑照片。这种用法已经成为社交媒体的一个标准部分——人们把图片ps一下,然后放到网上,以此作为“改进”图片的一种方式。在这项新研究中,研究团队通过添加人工智能将图像编辑提升到了一个全新的水平。
乍一看,DragGAN跟其他图像处理工具非常像。但创意团队发布的视频表明,它能够做到以前的应用程序都无法做到的事情,允许用户即时更改想象中的3D图像。研究人员称这些结果为“hallucinated occluded content”。
照片本质上是二维的。以前的照片编辑工具允许在其他图像中进行模糊、着色甚至修补。但所有这些编辑都是基于用户的努力——用户必须指导颜色校正或模糊皱纹。一种基于人工智能的照片编辑工具,通过分析成千上万张其他图像来识别特征,可以推断出图片中缺失的部分可能是什么样子,并在用户提示下据此做出更改。
例如,在一段视频中,一张愤怒的人的照片可以被改变为微笑的照片,这一切只需要点击和拖动。这个人的脸也可以转动,露出原来照片中从未捕捉到的头部部分。同样,汽车、动物或风景也可以通过几次点击和拖动来彻底改变。将人工智能添加到照片编辑中,为这一类别增加了一个全新的维度,它可以像Photoshop首次推出时那样引起轰动。
来源:https://techxplore.com/news/2023-05-ai-imaging-tool-interactive-3d.html