使用DataRobot和Databricks简化大数据和AI

2018年06月01日 由 荟荟 发表 941933 0

许多组织正在寻找将AI和分析应用于其业务的方法,这需要从数据准备到机器学习到部署一直受到关注。在DataRobot,我们很高兴地宣布我们与Databricks的合作伙伴关系,这使我们能够为公司提供强大的解决方案,以加速他们的分析创新和AI应用程序的构建。


Databricks 统一分析平台由Apache Spark™的原始创建者创建,通过统一数据工程,数据科学家和业务来加速创新。Databricks使组织能够在一个地方创建从ETL和交互式探索到生产的端到端数据管道,从而实现更快的价值实现,具有前所未有的性能 - 比Apache Spark快10-100倍。


 为什么选择Databricks和DataRobot


Databricks和DataRobot共同提供独特的工具组合,使人工智能和机器学习团队 - 从数据科学家到“公民数据科学家”,如业务分析师,软件工程师和数据工程师 - 通过提供项目所需的资源来提高工作效率成功。


Databricks为DataRobot用户提供统一分析平台,以提供ETL功能来清理,重新格式化,加入和优化数据集,从而构建机器学习模型。DataRobot为Databricks用户带来了自动化机器学习的强大功能,使他们能够快速构建,验证,测试和确定针对AI挑战的最佳机器学习模型。几分钟之内,DataRobot可以迭代数千种机器学习模型和参数的组合,这些组合可能需要数天或数周才能手动完成。


 使用Databricks和DataRobot时的端到端工作流程是:


  1. 将数据读入Spark Dataframe并转换数据




  2. 获取Spark DataFrame,然后将其序列化为Python DataFrame




  3. 将该数据发送到DataRobot以构建,训练和评估要考虑的机器学习模型的集合




  4. 在DataRobot中验证模型并检索模型洞察




  5. 为您的企业选择最佳模型,然后使用DataRobot的模型部署选项之一来操作模型




  6. 所选模型可以移入Databricks以大规模运行




Databricks和DataRobot共同使数据科学家和公民数据科学家能够加速和扩展机器学习模型的开发和交付。通过此次合作,两种解决方案的用户都可以获得自动化机器学习,强大的ETL以及快速模型开发和部署等关键功能。这极大地提高了工作效率,消除了分析过程中的瓶颈和AI应用程序的构建。

 
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
写评论取消
回复取消