英特尔推出新一代Neural Compute Stick驱动器,机器学习计算性能提升8倍
2018年11月15日 由 浅浅 发表
396273
0
自英特尔公司推出Movidius Neural Compute Stick以来,已经有一年多的时间了。这一售价79美元的拇指大小的驱动器,装有专为加速机器学习算法而设计的系统芯片,是英特尔于2016年9月收购的芯片制造商Movidius的产品。在此期间,数千名开发人员使用它,并在数十个研究项目中亮相。
本周在北京举行的英特尔首届AI开发者大会上,英特尔展示了Neural Compute Stick 2(NCS 2)。它抛弃了其前身的Myriad 2视觉处理单元(VPU),推出更强大的Myriad X VPU,英特尔声称它的总体计算性能是以前的8倍。在中国可以通过京东商城买到,价格为99美元。
英特尔将NCS 2作为原型AI算法的全栈解决方案,比如卷积神经网络(CNNs),它构成了许多图像识别系统的主干。英特尔物联网集团副总裁兼总经理Jonathan Ballon表示,它实际上是为测试智能相机、无人机、工业机器人和智能家居设备量身定制的。
Ballon指出,“在过去四年左右的时间里,AI已经在云端或数据中心中大量应用,如果你有大量的数据,并且你有无限的计算资源,以及电力和冷却系统,这是很好的。但在数据中心之外,功耗非常重要,热量和成本也是如此。利用NCS 2可以让客户很容易地抛开这些约束条件。”
Myriad X
NCS 2支持USB 3.0 / 3.1,这是对原始NCS USB 2.0的改进。它可以使用额外的NCS 2进行线性扩展。
引人注目的是,前面提到的Myriad X VPU,基于16纳米FinFET工艺,而不是Myriad 2的28纳米,拥有16个128位流混合架构矢量引擎(SHAVE)处理器内核(Myriad 2为12个),以及扩展的2.5MB芯片存储器和两个通用RISC内核。它包含新的低功耗视觉加速器,包括一个可以处理高达180Hz的双720p馈电的立体声模块,以及一个可调谐的集成信号处理器管道,采用基于硬件的编码,可在8个传感器上实现高达4K的视频分辨率。
值得注意的是,Myriad X是第一款采用英特尔神经计算引擎的VPU,这是一种专用硬件加速器,支持原生FP16和定点8位支持。
英特尔声称该芯片组的专用神经网络计算,可以达到每秒4万亿次的计算速度和每秒1万亿次运行,是深度神经网络推理中Myriad 2性能的10倍左右。
“它真正面向数据科学家或应用程序开发人员,他们希望根据各种功能限制从各种异构架构中获得最大性能,”Ballon说。
商业化AI
开发人员使用Movidius Compute Stick来制造各种设备,从鲨鱼识别无人机到低成本的皮肤癌筛查相机,而英特尔希望这次也能达到同样的效果
除了英特尔的计算机视觉SDK和Movidius计算SDK之外,NCS 2还支持OpenVINO(开放视觉推理和神经网络优化),这是一个用于AI边缘计算的工具包,它与Facebook的Caffe2和谷歌的TensorFlow等框架兼容,并为物体检测,面部识别和物体跟踪附带预训练的AI模型。
Ballon解释说,英特尔推出的营销力量主要体现在其去年推出的英特尔AI:In Production计划中,推出了NCS 2,它本质上是一个将AI原型推向市场的端到端平台。
他说:“我们希望超越学术试验和概念验证的范畴,帮助开发者生态系统的创新实现商业化。”
为此,开发人员可以通过可定制配置访问具有存储空间的英特尔AI DevCloud集群,以及可定制的英特尔Xeon Scalable处理器。一旦进行远程测试,优化和验证了模型,就会提供工具包和代码示例,使其更容易针对硬件进行开发,例如Aaeon Technologies等制造商提供的NCS 2或mini-PCIe开发板。
“这是我们硬件的单一平台,它汇集了软件工具,训练,专家和生态系统,并帮助开发人员找到合适的合作伙伴,无论他们是ISP还是云服务提供商,甚至是设备制造商,”Ballon说。
英特尔公司副总裁兼AI产品集团总经理Naveen Rao表示,“第一代NCS激发了整个AI开发人员社区的行动,我们很高兴看到社区通过英特尔NCS 2强大的计算能力增强创造力。”