DeepMind与Waymo合作让自动驾驶汽车更智能
2019年09月09日 由 KING 发表
315871
0
完善和改进为自动驾驶汽车提供动力的人工智能算法需要大量的训练。遗憾的是,目前的训练方法效率很低,因为它需要使用大量的数据来训练神经网络,否则研究人员必须花时间手工淘汰表现不佳的系统。
但是最近Waymo宣布在DeepMind的帮助下,它们找到了一种改进自动驾驶人工智能算法的方法,使整个训练过程更快、更有效。从某种意义上来说,人工智能系统的神经网络就是模拟人类大脑的算法,并通过大量的训练提高它们的计算能力。训练的过程就是给它们分配一个又一个的任务,根据它是否能够正确地执行任务以及与期望结果的落差得到一个评分。然后,神经网络通过再次尝试这些任务并在没有帮助的情况下纠正错误,已达到训练的目的。其意义是,在未来接受类似条件的任务时,神经网络能够对其权重因子做出必要的调整,从而尽可能正确地执行任务。
总的来说就是找到一种学习方法,确保人工智能系统在每次迭代后会变得更好。
目前找到最佳的训练方案有两种办法:一种是同时训练多个模型,另一种是让研究人员在训练时进行监控,人为的淘汰掉表现最差的模型。但是无论是这两种中的哪一种,都需要大量的资源与成本。Waymo和DeepMind的新方法是自动化淘汰过程,即用运行任务中性能更好的神经网络自动替换较差的神经网络。因为这种方法是让模型在人群中识别行人,所以他们将这种方法称为人群训练法(PBT)。
在实际的任务过程中,PBT每15分钟对神经网络模型进行一次评估。如果某个训练模型的表现不佳,则会替换为表现较好的模型,并稍微更改超参数。这容易让人联想到达尔文的优胜劣汰原则,它们之间互相竞争,看哪些模型会在竞争中存活下来。
DeepMind和Waymo发现,PBT可以提高神经网络识别行人、骑自行车的人和骑摩托车的人的能力。主要的数据指标有两个:神经网络识别的行人占场景中行人总数的比例和检测到的行人中实际为行人的比例。据DeepMind称,使用PBT可以减少24%的误差,同时保持较高的准确率。Waymo在博客文章中说,为了确保神经网络不是简单地记住他们在训练样本的答案(训练集),PBT使用了一组与训练时不同的样本(验证集),为了检测最终性能,该公司还使用神经网络在训练或验证中从未见过的第三组样本(评估集)。
跟据Waymo公司介绍,自推出以来,PBT已经应用到许多不同的WayMo车型上,有助于为道路创造自动驾驶能力更出色的车辆。