OpenAI推出深度强化学习资源Spinning Up,简单易懂
2018年11月09日 由 浅浅 发表
125822
0
OpenAI今天宣布推出Spinning Up,这是一个旨在让所有人能上手的深度强化学习的资源。
OpenAI以在虚拟环境中制作外观奇异的智能体而闻名,这些智能体学习如何独立行走,例如与华盛顿大学合作的Humanoid v2或POLO。
强化学习包括在激励的环境中向代理提供奖励信号,以最大化其奖励以实现目标。
强化学习在主要的AI突破中发挥了作用,例如DeepMind的AlphaGo和在Dota 2等环境中受过训练的智能体。
Spinning Up包括一系列重要的强化学习研究论文,理解强化学习所必需的术语表,以及一系列运行练习的算法。具体包括:
- 强化学习术语,各种算法和基础理论的简短介绍
- 一篇关于如何成长为强化学习研究人员的论文
- 一份按主题组织的重要论文目录
- 一份文档完整的关键算法的简短独立实现的code repo
- 一些作为热身的练习。
该计划的目的不仅是帮助人们了解强化学习是如何运作的,而且是为了通过让更多来自计算机科学领域的人安全地创建AGI来实现OpenAI的总体目标。
Spinning Up文档文本指出,“解决AI安全问题需要具备广泛专业知识和观点的人才,许多相关专业与工程或计算机科学毫无关联。尽管如此,所涉及的每个人都需要充分了解技术以做出明智的决策,以及需要的几个Spinning Up地址。”
Spinning Up的灵感来源于与OpenAI合作的学者和研究员,他们对AI有着好奇的兴趣,但在该领域缺乏经验。
除了在安全部署AGI的目标方面取得进展之外,创建该计划主要是因为目前没有单一的教科书可以提供实施强化学习所需的知识;目前的知识被锁定在一系列不同的讲座和有影响力的研究论文中。
Spinning Up项目是OpenAI提供更多教育服务的一部分。Spinning Up研讨会将于2019年2月举行,另一个研讨会将与加州大学伯克利分校的人类兼容AI(CHAI)中心共同举办。
教程:spinningup.openai.com/en/latest/user/introduction.html