Midjourney更新以类似相机的功能给AI艺术家带来惊喜

2023年06月25日 由 Camellia 发表 82959 0
Midjourney v5.2版本具有类似相机的缩放控制,增加了更多的逼真感。

在周四,Midjourney推出了其基于人工智能的图像合成模型的5.2版本,其中包括一项新的“缩放”功能,可以在保持中心合成图像的同时自动构建出一个更大的场景,模拟使用相机镜头进行缩放。

[caption id="attachment_53737" align="aligncenter" width="800"] Midjourney 5.2允许在合成图像上“缩放”。原始合成图像显示在这里的红色虚线框内。[/caption]

类似于OpenAI的DALL-E 2在2022年8月引入的一种AI图像技术——Outpainting,Midjourney的缩放功能可以将现有的AI生成图像的边界扩展,并将其原始主题保持在新图像的中心。但与DALL-E和Photoshop的生成填充功能不同,你不能选择自定义图像进行扩展。目前,v5.2的缩放功能只适用于在Midjourney内生成的图像,这是一项订阅式的AI图像生成服务。

在Midjourney的Discord服务器上(虽然已计划改变这种情况,但仍然是Midjourney的官方界面),用户可以通过生成任何v5.2图像(现在是默认设置)并对结果进行放大来尝试缩放功能。然后,在输出下方将出现特殊的“缩放”按钮。你可以按1.5倍、2倍或介于1和2之间的自定义值进行缩放。另外一个名为“Make Square”的按钮,将以创建1:1的正方形纵横比的方式,在现有图像周围生成素材。

[caption id="attachment_53751" align="aligncenter" width="740"] Midjourney 5.2生成的“女战士”的初始图像。[/caption]

[caption id="attachment_53755" align="aligncenter" width="740"] 该图像被Midjourney 5.2“缩放”了2倍。[/caption]

Midjourney的创建者David Holz在周四晚上在Discord服务器上宣布了新的v5.2功能和改进。除了“缩放”之外,最重要的新增功能包括全新的美学系统,承诺提供更好的图像质量,以及更强大的“--stylize”命令,能够有效地影响图像的非现实感。此外,还有一种新的“高变化模式”,默认情况下启用,可以增加图像生成中的构图多样性。另外,一个新的“/shorten”命令使用户能够评估提示,以尝试修剪掉不必要的词语。

尽管v5.2版本立即推出,Holz在公告中强调可能会进行不经通知的更改。通过使用“/settings”命令或在线命令参数“--v 5.1”,仍然可以使用Midjourney模型的旧版本。

[caption id="attachment_53757" align="aligncenter" width="740"] 在Midjourney v3(左)、v4(中左)、v5(中右)和v5.2(右)的输出之间进行比较,提示“一个肌肉发达的野蛮人在CRT电视机旁,带着武器,电影,8K,演播室照明。“[/caption]

对于这种有时被像Julie Wieland这样的支持者称为“合成摄影”的新图像合成艺术形式的粉丝来说,v5.2版本的改进是受欢迎的。一些Midjourney用户称其为“惊艳”和“令人惊叹”,这在当前充满炒作的人工智能世界并不是罕见的夸张形容词。但粉丝们可能会辩称,Midjourney的视觉改善证明了他们中间的惊人反应是合理的。

自2022年3月以来,在一系列的质量改进中,模型生成的图像从相对模糊且缺乏细节的形式发展到目前的形式。最近,Midjourney在今年3月推出了v5.0版本,5月推出了v5.1版本,这两个版本都提高了逼真度和图像细节。v5系列模型的推出使得可以创建出逼真的Pope Francis和Donald Trump等人的图像,引发了社交媒体上有关深度伪造的担忧。

[caption id="attachment_53777" align="aligncenter" width="740"] (左)根据“一个肌肉发达的野蛮人,在CRT电视机旁边拿着武器,电影,8K,演播室照明”提示生成的图像之一。
(中)在2倍缩放时,野蛮人的洞穴获得了更多的神秘细节。
(右)再次缩放2倍,我们现在可以看到一盏时尚的水晶吊灯。这真的是正式的卧室吗?[/caption]

尽管Midjourney的爱好者对新功能感到兴奋,但由于这些AI系统在训练过程中使用了没有经过艺术家咨询、认同或许可的数百万张从网上获取的图片,图像合成仍然在一些艺术家中引起了极大争议。Midjourney从未正式公开其训练数据的确切内容。Adobe正在尝试通过Firefly走向更具伦理道德的发展道路,但Venture Beat最近报道称,艺术家主动同意的情况仍然很少见。

目前,很难不欣赏Midjourney引人注目的技术进步,同时仍然思考是否有一条更具伦理道德的发展途径,一种能让传统艺术家和合成摄影师都满意的技术途径。

 

来源:https://arstechnica.com/information-technology/2023/06/stunning-midjourney-update-wows-ai-artists-with-camera-like-feature/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
写评论取消
回复取消