人类编程或教授给计算机最困难的事情之一是创造性的思考。计算机能非常好地完成我们告诉他们做的事情并且完成速度很快,但是创造是一个抽象的概念,教机器创造已经被证明给机器学习带来了很大挑战。
6月份,罗格斯大学(Rutgers)发表了发表了一篇研究论文,向世界介绍了创意对抗网络(CAN)。从下图可以看出,他们训练的CAN做了一个特殊的工作,既创造出一个看起来像是由真正的艺术家制作的东西,而且它们是独一无二的,而不是已经存在的艺术作品的仿造品。
CAN基于几年前伊恩·古德费洛和他的同事创建的生成式对抗网络(GAN)。想要了解CAN,你需要先了解GAN。
GAN是一种由发生器(generator)和鉴别器(discriminator)两个神经网络组成的神经网络。
鉴别器的任务是将图像作为输入并确定它们的真假(即由人类创造还是由发生器创造)。
发生器机的任务是生成新的图像,欺骗鉴别器认为它们是真实的。
通过向鉴别器馈送由发生器和真实图像混合组成的假图像,它学习识别有助于将每个图像分类为真实或假的图案。同时,发生器获得关于哪些图像最好地欺骗了鉴别器的反馈,以及如何改变其策略以更好地欺骗它。
鉴别器和发生器之间的竞争推动它们的工作变得更好,而当GAN被正确地训练时,发生器输出的结果可以看起来非常逼真(http://guimperarnau.com/blog/2017/03/Fantastic-GANs-and-where-to-find-them)。
CAN以几乎与GAN相同的方式构建,但是通过一个关键的附加功能,让发生器能够创造性地“思考”...
鉴别器仍然尝试学习如何将每个图像分类为真的或假的,但它也学习如何将图像分类为25种艺术风格之一(即立体派,抽象,文艺复兴,现实主义等)。
发生器仍然试图欺骗鉴别器认为它产生的图像是真实的,但它也试图使鉴别器难以将图像分类为25种艺术风格之一。
为了理解为什么将图像分类添加到艺术风格中可以让发生器创造性地思考,我们需要一个机器可以模仿的创造的具体定义。
CAN理论依据是:研究者认为创造力能被观众所感知是当一件艺术品独一无二并且不是太离谱的时候。罗格斯大学的研究人员在他们的论文中这样描述了这种状态。
过少的刺激会被认为是无聊的,太多则会激活厌恶系统导致出现负面反应。
让我们回顾一下,思考这个与CAN架构有什么关系。通过生成器来生成鉴别器不能轻易地将其分类为一种艺术风格的图像,因此它被迫生成独特(有创意)的图像。同时,发生器仍然需要欺骗鉴别器来认为图像是真实的,所以它不能产生太明显不同的图像
通过这种方式,CAN模拟了我们所认为的艺术创造力的定义。
以上表格比较了四组艺术作品是如何通过人类观众样本进行评分的。DCGAN图像由标准GAN创建(没有艺术风格的图像分类使其能够创造性地思考)。这些图像看起来像真实的艺术,但他们基本是模仿定义的艺术风格。他们不会创造性地思考。
CAN这组显然是由创意对抗网络生成的一组图像。
抽象表现主义(Abstract Expressionist)和2016年巴塞尔艺术展(Art Basel 2016)数据集都是现代艺术作品的集合。抽象表现主义数据集由1945年至2007年间创建的图像组成;2016年巴塞尔艺术展(Art Basel 2016)是当代艺术博览会(Art Basel 2016)上展示的一系列图片。
令人印象深刻的是,来自CAN数据集的图像在新奇,令人惊讶,模糊和复杂性方面排名最高(分别对应图中Novelty,Surprising,Ambiguity和Complexity)。他们也更好地欺骗观众认为他们是由人类创造的,而不像GAN之类的东西创造的。
此外,CAN的创造者认为,CAN和抽象表现主义图像集之间的一部分剩余的差异是创造性地考虑CAN思考的结果。抽象表现主义数据集中的图像对于艺术观众来说是熟悉的,因为它们较旧,并且适合于定义的艺术风格。与“2016巴塞尔艺术展”形象相比,人类实际上发现最严格的标签是真或假。
你可以认为,人类发现“巴塞尔艺术巴塞”2016图片更加硬派,因为他们的定义更具创意。通过扩展,可能的是,CAN应该理想地创建比人类更难以将其分类为真或假的图像,而不是熟悉的艺术风格的图像。
无论哪种方式,CAN都是创造性地参与艺术的机器学习的巨大飞跃。
如果你想从罗格斯大学读整本CAN研究论文,可以在这里找到。