计算能力是研究的基础
2019年09月23日 由 TGS 发表
295892
0
神经网络为研究人员提供了一个展望未来的有力工具,但可惜不是完美的——无法满足研究人员对数据和计算能力的需求。
据估计,麻省理工学院对计算机的需求有五倍的缺口,为了帮助缓解危机,工业界已经介入。IBM最近捐赠的一台价值1160万美元的超级计算机将于今年秋季上线,在过去的一年里,IBM和谷歌都为麻省理工学院的智能探索提供了云计算,具体项目如下:
更小、更快、更智能的神经网络
如果要识别一张猫的图片,深度学习模型可能需要看到数百万张照片,然后它的人工神经元才能“学习”识别猫。这一过程是计算密集型的,并且会带来巨大的成本,因为试图测量人工智能(ai)碳足迹的新研究已经凸显了这一点。但麻省理工学院的最新研究却表明,或许不用那么密集,模型只需要很小的一部分。麻省理工学院电子工程与计算机科学系(EECS)的研究生乔纳森•弗兰克(Jonathan Frankle)说:“当你训练一个大的网络时,有一个小的网络可以做任何事情。”
通常情况下,神经网络在训练过程后进行修剪,然后去除不相关的连接,如果一开始就能找到正确的子网络,那么神经网络的连接数只需十分之一。既然如此,那为什么不从训练小模型开始呢?
弗兰克在笔记本电脑上试验了一个双神经元网络,得到了令人鼓舞的结果,通过IBM Cloud,他获得了足够的计算能力来训练一个真正的ResNet模型,并在Facebook的办公室里发表了上述言论。
分辨真假新闻
Facebook和Twitter这样的社交平台能找到高质量新闻,但在绝大多数情况下,这类新闻都被网上发布的误导或完全错误的信息淹没了。美国众议院议长南希·佩洛西(Nancy Pelosi)最近的一段视频被人恶意篡改成醉酒后发言,这是错误信息和假新闻对民主构成威胁的最新例子。网络似乎成了法外之地,乌烟瘴气。
如果技术造成了问题,那么技术也可以解决问题。——这就是Nadeem选择开展superUROP项目的原因,该项目的重点是:建立一个自动化系统,以打击虚假和误导性新闻。
在谷歌云平台的帮助下,Nadeem进行了核实事实的语言模型实验,并建立了一个互动网站,让用户可以立即评估索赔的准确性。他和他的合著者在6月份的北美计算语言学协会(NAACL)会议上展示了他们的研究结果,并表示将继续扩展这项工作。
通过一些动作识别运动员
只需要几个动作,计算机视觉模型识就可以在赛场上的运动员群体中识别出单个运动员个体。这是由麻省理工学院(MIT)智能探索(Quest for Intelligence)研究员凯瑟琳·加拉格尔(Katherine Gallagher)领导的一个团队进行的初步研究得出的结论。
研究小组对电脑视觉模型进行了网球、足球和篮球比赛的录像训练,结果发现,这些模型只需要几帧就能从球员身上的关键点辨认出他们的个人,从而勾勒出他们的骨骼轮廓。
该团队使用谷歌云API来处理视频数据,并将他们的模型的性能与谷歌云的AI平台上训练的模型进行了比较,研究结果与运动分析系统中的自动球员识别有关,并且可以为进一步研究推断球员疲劳、预测何时应该换下球员提供基础。自动姿态检测还可以帮助运动员改进他们的技术,使他们能够分离出与高尔夫球手的专业击球或网球运动员获胜挥杆相关的精确动作。
三个例子简单明了,也很有意思,但我想表达的却是,如果没有IBM与谷歌提供帮助,那么这些有趣的研究将何去何从呢?