英特尔开发强化学习系统，可实现控制3D类人等复杂AI任务

登录注册

行业学习

支撑

数据算量系统

企业招聘智能体

下载

模型数据集

AI工具箱

企业服务

EVA 智能HR

ChatGPT 人工智能应用人工智能未来计算机视觉

热门新闻

公司板科大讯飞

科大讯飞包揽ICPR MTWI图文识别挑战赛三项冠军

行业人工智能

所以，能动手就别吵吵了

行业人工智能

人工智能对 IT 技能和人才发展的影响

常用工具

ChatGPT

OpenAI旗下AI对话工具

火山写作

字节跳动旗下团队推出的免费AI英语写作助手

Midjourney

AI图像和插画生成工具，测试测试测试测试测试测测试

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub Copilot

GitHub AI编程工具

您尚未登录账户

请先登录您的atyun账户，方可使用该功能

仅限企业账户使用

该功能仅限企业账号使用，开通企业账号可享受更多服务，是否现在注册企业账号？

立即注册企业账号

暂不需要

您的企业账号申请正在审核中

审核通过后即可使用此功能，请耐心等待~

2019年06月12日由 bie管我叫啥发表 749514 0

英特尔AI实验室和俄勒冈州立大学协作机器人和智能系统研究所展开一项研究，结合了多种方法来制作性能更好的强化学习系统，可应用于机器人，自主车辆功能控制和其他复杂AI任务。

该系统名为协同进化强化学习（CERL），可以在Humanoid、OpenAI的Hopper和Walker2D等基准测试中实现更好的性能，比基于梯度的算法或用于强化学习的进化算法更优秀。

使用CERL方法，研究人员能够使一个3D类人智能体在OpenAI的类人基准上直立行走。

这些结果部分是通过训练系统实现的，这些训练系统探索更多的强化学习训练环境，以寻求奖励并完成特定任务。

环境探索对于确保记录各种经验并考虑行动方案非常重要。研究人员在一篇解释CERL如何运作的论文中表示，与环境探索相关的问题已经出现，特别是随着使用深度强化学习来完成具有挑战性的现实任务的流行，这些问题变得更加突出。

论文写道，“神经进化将整个过程联系起来，产生一个超出任何个体学习者能力的自然学习者。”

CERL结合了基于策略梯度的强化学习和进化算法，然后在每批或一代训练系统中选择表现最佳的神经网络。这样，研究人员可以使用最强大的神经网络来创建新一代系统，并且可以将计算资源分配给实现最佳性能的算法。

CERL还结合了重放缓冲区，用于存储学习者在环境中的体验，以便创建单个重放缓冲区并在系统之间共享体验，从而实现比以前方法更高的样本效率。

论文：

arxiv.org/abs/1905.00976

标签：

行业英特尔

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇 Facebook发布PyTorch Hub，用于重现AI模型结果

下一篇 Clarifai：反馈循环长期保持高质量的AI结果

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

最好的基于Transformer的LLM（上）