AI花开三朵,如何完整绽放?
2017年09月08日 由 meng 发表
650973
0
9月7日,AICC人工智能计算大会在北京召开,不同于业界所有与AI有关的大会之处在于这场会议多了“计算”两个字,尤为关键,这是为什么呢?
在云计算和大数据之后,AI成为了当前最热门的风口。最新数据显示,中国目前已经拥有了592家人工智能公司,占据全球总数的23%,仅2016这一年,中国在AI领域就有了超过200亿元的投资。
虚热不断的IA概念,却往往忽略了技术本身。中国工程院院士、浪潮集团首席科学家王恩东表示:“人工智能的发展、人工智能的支撑,离不开计算、算法和数据这三大属性。尤其是计算,正是由于计算能力的快速发展,结合互联网、物联网带来的海量数据和深度学习等先进算法,才共同催生了第三次人工智能浪潮。”
由此可见,计算、算法与数据三个维度的突破,有了AI绽放的可能。
市场环境为数据及算法打下基础
前段时间我国发布了《新一代人工智能发展规划》,将AI正式上升到了国家战略,AI将在我国从“世界工厂”向“世界智能工厂”转型中将起到重要作用。
这表明,政策换将对AI产业的支持正在向更好的方向发展。《新一代人工智能发展规划》是7月20日公布的,其中明确指出了中国AI“三步走”战略、八大关键技术研究、数十个产业落地、AI人才的培养和引进和成立AI规划推进办公室等战略规划。
这也可以说是中国AI产业发展的总体纲领,也为AI发展所需的技术环境打下了基础。由于AI创新应用的发展离不开数据的开放与共享。从国际上看,开发、开放及共享政府数据已经成为了普遍潮流,英美等发达国家已经在公共数据驱动AI方面获得了一定的成效,而我国之前仍然缺少国家层面的整体战略设计和部署,政府数据开放仍然处在起步阶段。因此,有了国家政策的支持,数据的开放㛑会慢慢深入,这对AI在数据层面的完整和健全会起到非常明显的作用。
其次是在算法层面。由于互联网公司的崛起,他们是最早一批布局AI的企业,因此,在最近几年,笼络了大量机器学习的人才,与此同时又有互联网实物的实践,所以对算法层面的进步起到了不小的作用。
可以说是政策环境驱动了数据链条的完整,而市场环境驱动了算法的进步。那计算力的发展需要靠谁来推动呢?王恩东说:“尽管计算已经有了快速的发展,但面对人工智能这样一个蓬勃发展的需求,仍然面临着许多挑战,排在第一位的仍然是计算性能。”正式为了使计算不再是AI的短板,AICC人工智能计算大会的意义就是让数据、算法及计算达到融合,并做到助推AI产业升级的目的。
计算支撑优化组合,做到在AI时代胜出
事实上,我们会发现但凡在AI领域走的比较早的企业,他们所建立起来的优势很难被动摇。这些公司大多数都是互联网公司,首先互联网公司更早的看到了数据的价值,因此他们的数据链条相对完善;其次,互联网公司切入AI更早,因此学习的算法和成果更出色,后来者要想追赶这些公司的步伐,即使有同样的数据,也需要很长一段时间的深度学习来达到先行者如今的水平。
这难道就是一个无解的难题吗?
高效能服务器和存储技术国家重点实验室科学家、浪潮集团总裁胡雷钧表示:“大家所说的人工智能三要素,数据,模型算法,和计算能力。谁能够把这三个组成一个性价比最优的组合,谁就能胜出。”
例如,如果数据少,但是模型算法更好,这就表示层次更多、节点更多,精确度更高。那么,模型越大,需要的计算能就越强。然而更好的模型以及更强的计算能力的组合,也许会弥补在数据上的不足。由此可见,计算力的提升实际上会给予AI公司很大的想象空间。
然而对于算法的发展,胡雷钧也寄予了很高的期望,他说:“计算能力和数据实际上是需要钱的,是需要大投资的,还需要实践的积累和投资的积累,反而在计算模型上的投入,有可能在有限投资的情况下获得更大的收益,获得更大的平衡。”
这说明了什么?算法模型上的巨大突破,也会弥补计算力的不足。因此,AI领域中的机器学习,现在的算法和计算的发展会相互推动,再进行进一步组合,实现现在不能想象的未来。胡雷钧表示:“如果说,今天的人工智能公司,投入的早积累的多,就有优势,可是以后就未必。”
以前业界对于IA的关注,过于局限在算法与数据两个方面,然而我们经过这些理论和与实践就会发现,计算对于AI发展的重要程度正在日益显现。
打破AI计算的瓶颈,建立体系化的生态系统
最近几年,AI技术虽然发展迅速,但是却比较零散,并没有一个公认的技术体系。胡雷钧表示:“AI要想继续往前发展,就必须体系化、层次化的构建它的生态系统。有一个相对完整的生态系统的支撑,我们才能推动计算系统能够面向应用需求。在具体的实践中,我们认为AI的计算平台、AI的系统管理、AI的计算框架、AI的应用方案作为一个生态系统里不可或缺的几个重要环节,在滚动推动着AI的发展。”
随着更多的AI应用的出现,AI计算平台也会遇到很多瓶颈,例如数据的瓶颈、延迟的瓶颈、计算能力的瓶颈以及通信能力的瓶颈等等。这里有三个核心的问题:一是处理单元能够多块速度取得它处理的数据;二是每次处理之后能够以多快的速度去交换数据,这是通讯问题;三是在单位的空间内能够集成多少计算能力。胡雷钧表示:“这是约束着一个计算系统最大规模也是约束着我们能以多快的时间完成一个模型的训练的问题。”
因此,在这些需求之上,浪潮构建了自己的AI价值体系。
首先是局域计算平台的创新:由于提高单位空间之内的计算能力及计算单元之间交互数据的能力,浪潮在2U空间内可以集成8个,甚至未来也许更多的GPU处理器,来获得更高的计算能力。浪潮还通过服务器与GPU BOX的分离,具有了更灵活的计算组合,以便适应于各种不同的神经网络的模型。
其次,在管理平台上,浪潮在思考怎样将云计算的技术、云计算调动大规模运算的技术应用到AI计算上来,为AI开发者和运维者面临的各种巨量的运算应用提供一个管理模式,因此浪潮提供了一个计算框架的分析工具,通过这个分析工具能够细微的看一个具体的神经网络的模型在某个计算平台中的运算表现,或者是系统瓶颈。
第三,是AI的框架,浪潮做了Caffe-MPI。浪潮是第一个将Caffe的计算模型从原来的单机版扩展成集群版,通过这个集群版能够做到在一个系统中运行更大尺寸的神经网络,同时通过MPI的编程可以更有效的调动系统的资源来完成一个高性能计算。
胡雷钧表示:“这实际上就是把我们在高性能计算领域里的应用模式和应用方法移植到了AI的平台上,通过我们原先已经有的在大规模计算平台上的经验,提高AI应用或者说提高神经网络的训练效率。”值得注意的是,目前Caffe-MPI还是一个由浪潮贡献的开源项目。
第四,面向AI的应用。浪潮提供了E2E的解决方案。在一整套大方案中,浪潮有高密度高性能的模型训练的平台AGX-2,他是目前为止世界上最高密度的AI计算平台,在2U空间之内支持NVLink,支持P100GPU,有基于FPGA的F10A加速卡,有高效的人工智能管理平台AIStation,有高性能深度学习框架Caffe-MPI,同时浪潮还有十分有经验的工程师队伍能够帮助优化算法。
在这些不同层面的投入的基础上,浪潮打造了一个面向AI的生态,就像胡雷钧说的那样:“浪潮希望在产业基础的推动下往前滚动发展,未来一定能更好的支持我们的AI应用,无论是训练、学习、现在的监督式学习还是正在发展的自主学习、未来终极目标类脑的学习,都会以非常好的基础来支撑我们。”
AICC人工智能计算大会的意义是重新定义了,计算在AI价值体系中的定位,以计算为支撑实现计算、数据及算大三者的优化组合,并且相互促进,最终开出的才是AI最美的花朵。