思科公司发布强大的AI服务器UCS C480 ML M5
2018年09月11日 由 浅浅 发表
979658
0
AI算法在理论上是很好的,但如果你没有强大的硬件来部署它们,它们基本上是无用的。使用传统计算机,复杂的模型可能需要数小时,数天甚至数周才能进行训练。
但Cisco(思科)公司准备解决这个问题。公司今天宣布扩展其统一计算系统(UCS)服务器产品组合,该产品组合专注于AI,特别是那些希望启动和运行AI系统的IT组织。
首先是新硬件:UCS C480 ML M5。它是一个配备Intel Xeon可扩展处理器的4U服务器,八个带有高带宽NVLink互连的Nvidia Tesla V100-32G GPU,以及CPU,网络,存储,内存和软件前端的灵活选项。顶级配置拥有双Xeon处理器,高达128GB的2666MHz DDR4 RAM,24个SATA硬盘或SSD,6个NVMe驱动器和4个x100G虚拟接口卡(VIC)。
“我们开发这个系统的原因纯粹来自我们安装基础的需求,”数据中心营销高级主管Todd Brannon在接受采访时表示。他提供了一些支持统计数据:大约有八分之一的公司已经采用AI作为客户解决方案,或计划在2020年之前实现这一目标,届时预计这将是一个1.2万亿美元的行业。
“GPU与减少训练模型所需的时间非常相关,特别是在深度学习中,”他说。“我们看到训练时间减少了一个数量级。”
UCS服务器与容器化应用程序(在与更广泛的系统隔离的自己的操作环境中运行的应用程序)和多云计算模型(具有跨服务存储的数据集的AI系统)一起使用,并且它与思科的AI解决方案堆栈完全兼容。这包括MapR的数据管道;Cloudera的Data Science Workbench,支持TensorFlow和PyTorch等框架;Hortonworks的Hadoop 3.1。思科正在努力验证UCS C480 ML M5存储数据并运行容器化Apache Spark和Google TensorFlow分析工作负载的设计。
Brannon表示,“如果你准备一个大型数据集来输入模型或算法,那么数据就是中心,而且它是可变的,它可能会在几天内变成10 PB的运动......我们的策略是采用这种新的数据水平,包括用于测试,开发,训练和推理的计算选项,所有这些都由基于云的管理统一。”
思科正在为谷歌的Kubeflow开源项目提供代码,该项目将TuberorFlow与管理容器化工作流和服务的平台Kubernetes集成在一起。它也正在与Anaconda合作,以“确保数据科学家能够使用Python等语言开始机器学习。”
Brannon补充道,“在过去的五到四年里,我们看到我们的大数据业务增长了18倍,从全球企业客户到公共部门,所有不同行业都有需求。凭借UCS C480 ML M5,我们正在回应对新型加速计算平台的需求。我们正在与领先的生态系统合作伙伴一起策划自上而下的软件和硬件堆栈,以确保更快,更可预测的部署。”
UCS C480 ML M5将于今年第四个季度上市。