斯坦福大学重大突破：直接在光学芯片上训练人工神经网络

2018年07月27日由浅浅发表 198951 0

斯坦福大学研究人员已经证明，可以直接在光学芯片上训练人工神经网络。这一重大突破表明光学电路可以执行基于电子的人工神经网络的关键功能，并且可以更便宜，更快速和更节能地执行诸如语音或图像识别之类的复杂任务。

大学的研究小组负责人Shanhui Fan表示，“使用光学芯片比数字计算机更有效地执行神经网络计算可以解决更复杂的问题，例如，这将增强人工神经网络执行自动驾驶汽车所需任务的能力，或者对口头问题做出适当的反应。它还可以用我们现在无法想象的方式改善我们的生活。”

人工神经网络是人工智能的一种，它使用连接单元以类似于大脑处理信息的方式处理信息。使用这些网络执行复杂的任务，例如语音识别，需要训练算法的关键步骤来对输入进行分类，例如不同的单词。

尽管最近光学人工神经网络已经通过了实验证明，但是传统研究是在数字计算机上使用模型进行训练，然后最终设置导入光学电路。在光学学会的高影响力研究期刊Optica中，斯坦福大学的研究人员报告了一种新方法，通过实现“反向传播”算法（这是训练传统神经网络的标准方法）的光学模拟直接在设备中训练这些网络。

“使用物理设备而不是计算机模型进行训练可以使过程更加准确，”该论文的第一作者Tyler W. Hughes表示，“另外，由于训练步骤是神经网络实现中非常耗费计算的一部分，因此光学执行此步骤对于提高人工网络的计算效率，速度和功耗至关重要。”

基于光的网络

尽管通常使用传统计算机执行神经网络处理，但是设计专门针对神经网络计算优化的硬件仍有很大的努力。基于光学的设备非常令人感兴趣，因为它们可以并行执行计算，同时使用比电子设备更少的能量。

在这项新工作中，研究人员通过设计一种复制传统计算机训练神经网络方式的光学芯片，克服了实施全光学神经网络的重大挑战。

一个人工神经网络可以被视作带一些旋钮的黑盒子。在训练步骤期间，这些旋钮各自转动一点，然后测试系统以查看算法的性能是否得到改善。

Hughes表示，“我们的方法不仅可以帮助预测转动方向的方向，还可以预测每个旋钮的旋转程度，从而更接近所需的性能。我们的方法显着加快了训练速度，特别是对于大型网络，因为我们可以并行获取有关每个旋钮的信息。”

片上训练

新的训练协议在具有可调谐分束器的光学电路上运行，可通过改变光学移相器的设置来调整。编码待处理信息的激光束被发射到光学电路中并由光波导通过分束器携带，分束器被调节为类似旋钮以训练神经网络算法。

在新的训练协议中，首先通过光学电路馈送激光。退出设备后，计算与预期结果的差异。然后该信息用于产生新的光信号，该信号通过光网络以相反的方向发回。通过在此过程中测量每个分束器周围的光强度，研究人员展示了如何并行检测神经网络性能相对于每个分束器设置的变化。可以基于该信息改变移相器设置，并且可以重复该过程直到神经网络产生期望的结果。

研究人员通过教授算法执行复杂任务，来测试训练技术和光学模拟，他们发现光学实现与传统计算机类似地执行。

Fan指出，“我们的工作表明你可以使用物理定律来实现计算机科学算法，通过在光学领域训练这些网络，它表明光学神经网络系统可以构建为仅使用光学器件来执行某些功能。”

研究人员计划进一步优化系统，并希望用它来实现神经网络任务的实际应用。他们设计的一般方法可以与各种神经网络架构一起使用，也可以用于其他应用，例如可重构光学器件。

标签：

行业神经网络

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇 MIT研究：开发机器学习模型使计算机更自然地解释人类情绪

下一篇 DeepMind开发新AI：学习理解其他AI思想并进行预测

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

最好的基于Transformer的LLM（上）