密歇根大学训练自动驾驶汽车识别和预测行人的运动
2019年02月14日 由 浅浅 发表
421935
0
通过研究人类的步态,身体对称性和脚的位置,密歇根大学的研究人员正在教自动驾驶汽车更精确地识别和预测行人运动。
车辆通过摄像头,激光雷达和GPS收集的数据,使研究人员能够捕获运动中的人类视频片段,然后在三维计算机模拟中重建它们。在此基础上,他们创造了一个“生物力学启发下的循环神经网络”,用来记录人类的运动。
团队可以预测距离车辆大约50码的一个或几个行人的姿势和未来的位置。这相当于在一个城市的十字路口。
美国机械工程硕士助理教授Ram Vasudevan说:“先前的研究通常只关注静止图像,并不关心人们如何在三维空间中移动。但如果这些车辆要在现实世界中运行和互动,我们需要确保我们对行人所在位置的预测与车辆下一步的位置不一致。”
为车辆配备必要的预测能力需要网络潜入人类运动的细节:人类步态的速度(周期性),肢体的镜像对称性以及脚部放置在行走过程中影响稳定性的方式。
将自动技术提升到目前水平的机器学习,大部分都是处理二维静止图像。一台计算机显示了数百万张停车标志的照片,最终将在现实世界和实时中识别停车标志。
但是,通过使用运行几秒钟的视频片段,U-M系统可以研究片段的前半部分进行预测,然后通过后半部分验证准确性。
为了解释神经网络可以做出的推断,Vasudevan描述了一个常见的景象。“如果一个行人正在玩他们的手机,他们会分心,他们的姿势和他们正在寻找的地方会表现出他们的注意力。它也告诉你很多关于他们下一步能做的事情。”
结果表明,这种新系统改进了自动驾驶汽车识别下一步最有可能发生的事情的能力。
“我们预测的中位平移误差在1秒钟后大约为10厘米,在6秒钟后小于80厘米。所有其他比较方法最多可达7米,我们更擅长预测一个人的位置。”
为了控制预测下一个动作的选项的数量,研究人员应用了人体的物理约束条件。为了创建用于训练U-M神经网络的数据集,研究人员在Ann Arbor的几个十字路口停放了一辆具有4级自动驾驶汽车。由于汽车的摄像头和LiDAR面向交叉路口,车辆可以一次记录多天的数据。
研究人员在实验室中捕获了传统姿势数据集中的真实世界数据。结果该系统将提高自动驾驶汽车的能力。
团队表示,“我们对各种应用和令人兴奋的跨学科合作机会持开放态度,我们希望为更安全,更健康,更高效的生活环境做出贡献。”