来自神经网络的物理学见解
2020年01月09日 由 KING 发表
703258
0
基于神经网络的机器学习模型是许多最新技术进步的源动力,包括文本的高精度翻译和自动驾驶汽车。研究人员也越来越多地使用它们来帮助解决物理问题。神经网络已经确定了物质的新阶段,从高能物理实验数据中检测到有趣的异常值到在图谱中找到了被称为引力透镜的天文物体无不囊括。但是,尽管通过神经网络获得的结果激增,但该工具的内部工作仍然难以捉摸,而且通常不清楚网络如何处理信息以解决问题。现在,位于苏黎世的瑞士联邦技术学院(ETH)的一个团队展示了一种找到此信息的方法。科学家可以使用他们的方法以全新的方式查看问题以及解决问题的途径。
神经网络是一种计算工具,其操作可大致模拟人脑的操作。该网络通常由多层连接的人工神经元组成,这些层进行计算,对神经元之间的连接进行加权,这些权重(从数百万到数十亿)会形成网络的可调参数。神经网络的优点在于不需要对它们进行编程即可解决任务。相反,他们通过示例学习如何调整参数,以使他们输出的解决方案随时间而改进。例如,为了训练神经网络来识别人脸,该网络将获得同一个人的许多不同图片。然后,网络学会识别该面孔,更改连接的权重,直到其识别质量足够可靠的结果为止。
虽然神经网络可以学习解决各种各样的任务,但是这些模型的内部运作通常是一个黑匣子。了解网络所学知识的一种方法是查看其权重。但是由于数量众多,这样做通常很棘手。对神经网络的运行方式缺乏了解在物理学上尤其令人不满意:该工具可以解决具有挑战性的问题,但我们不知道它用于生成解决方案的规则和原理。那是Raban Iten,Tony Metger及其同事的新结果出现在的地方。
该团队从一个由七层组成的标准神经网络开始。然后,他们以两种关键方式修改了网络。首先,他们改变了网络的中间层,使其神经元少于其他层,从而形成了所谓的信息瓶颈。例如,在一种情况下,他们将该层包含的神经元数量从100个减少到2个(图1)。(在这种情况下,输入和输出层也都有两个神经元)。在其他情况下,更改的层具有更多的神经元,但数量始终少于10。其次,他们对更改的层进行了编码,以便其每个神经元都包含独立的信息。他们用来进行这种编码的技术称为变量解缠,来自计算机视觉领域。回到面部识别示例,此修改意味着更改后的层中的一个神经元可能包含嘴巴的形状,而另一个可能包含眼睛的大小。这两个修改在一起意味着,最终的神经网络(SciNet)具有几个参数层,其中每个神经元都包含有关所解决问题的独立属性的信息,从而使该网络更易于研究。团队正是通过这一层调查网络内部工作的。为了研究神经网络,研究小组要求SciNet解决各种物理问题,其中最具代表性的是天文学。对于此问题,SciNet得到了火星和太阳的角坐标,它们是相对于某些固定恒星从地球测量的。然后要求神经网络预测这些天体的未来位置。训练过程结束后,研究小组查看了他们在网络第四层中拥有的两个神经元的权重,以深入了解SciNet如何解决任务。通过分析中间层神经元的输出,他们发现SciNet执行了坐标转换,改变了火星的角度,因此似乎是从太阳而不是从地球测量的。
ETH团队的演示使他们了解了神经网络如何解决各种特定任务。但是结果具有更重要的意义。通过了解神经网络的内部工作原理,物理学家可以使用它们来获得对问题的新见解和概念性理解,而不仅仅是最终的答案。例如,可以训练SciNet预测量子系统的测量结果,以了解网络如何将量子力学的数学理论与现实联系起来。SciNet的另一个令人兴奋的机会是研究星系的旋转曲线。物理学家仍然不理解为什么银河系中的恒星旋转得比预言所表明的可见质量要快,这导致了宇宙中存在一些未知的“暗物质”质量的假设。了解SciNet是否通过添加隐藏的暗物质质量,修改引力定律或使用天体物理学家可以解释的完全不同的表示形式来解决该问题,将是很棒的。SciNet的答案可以帮助研究人员指出新的方向来解决这个长期存在的重要问题。
因此,这项工作迈出了一步,将机器学习模型用作科学灵感的来源,帮助研究人员找到有关物理问题的新思路并增强人类创造力。希望在几年内,当这些方法被更好地理解并应用于未解决的科学问题时,它们将导致新的概念性理解,从而加速物理学本身的进步。