许多组织正在寻找将AI和分析应用于其业务的方法,这需要从数据准备到机器学习到部署一直受到关注。在DataRobot,我们很高兴地宣布我们与Databricks的合作伙伴关系,这使我们能够为公司提供强大的解决方案,以加速他们的分析创新和AI应用程序的构建。
Databricks 统一分析平台由Apache Spark™的原始创建者创建,通过统一数据工程,数据科学家和业务来加速创新。Databricks使组织能够在一个地方创建从ETL和交互式探索到生产的端到端数据管道,从而实现更快的价值实现,具有前所未有的性能 - 比Apache Spark快10-100倍。
为什么选择Databricks和DataRobot
Databricks和DataRobot共同提供独特的工具组合,使人工智能和机器学习团队 - 从数据科学家到“公民数据科学家”,如业务分析师,软件工程师和数据工程师 - 通过提供项目所需的资源来提高工作效率成功。
Databricks为DataRobot用户提供统一分析平台,以提供ETL功能来清理,重新格式化,加入和优化数据集,从而构建机器学习模型。DataRobot为Databricks用户带来了自动化机器学习的强大功能,使他们能够快速构建,验证,测试和确定针对AI挑战的最佳机器学习模型。几分钟之内,DataRobot可以迭代数千种机器学习模型和参数的组合,这些组合可能需要数天或数周才能手动完成。
将数据读入Spark Dataframe并转换数据
获取Spark DataFrame,然后将其序列化为Python DataFrame
将该数据发送到DataRobot以构建,训练和评估要考虑的机器学习模型的集合
在DataRobot中验证模型并检索模型洞察
为您的企业选择最佳模型,然后使用DataRobot的模型部署选项之一来操作模型
所选模型可以移入Databricks以大规模运行