强化学习，深度学习的合作伙伴

2019年12月12日由 KING 发表 186409 0

今年，我们已经看到了有关AI深度学习的许多研究。借助最新的研究成果，深度学习证明了其在许多行业中执行诸如图像识别、语音识别、价格预测之类任务的实用性。深度学习有一个相对未知的合作伙伴：强化学习。当AI研究人员冒险进入未知的学习领域并尝试提供AI学习功能，强化学习将发挥关键作用。

什么是强化学习？

想象一个通过与环境互动来学习的孩子。每次互动都会产生一种感觉，可以带来反馈。例如，花的宜人香味会诱使孩子再次去闻花的气味。花茎刺引起的疼痛会提醒孩子，避免再次触摸茎梗。

在每种情况下，当孩子与环境互动时，环境都会通过反馈孩子不同的感觉来往复运动并教给孩子。这孩子正在反复试验中学习。

这就是强化学习。在强化学习中，主体从中立状态开始，然后在采取措施时，环境帮助主体从中立状态过渡到其他状态。在这些其他状态下，可能会对主体有所反馈。

强化学习的应用

强化学习已经在许多行业中广泛使用，例如制造、库存管理、交付管理和金融。

在制造业中，机器人使用强化学习在装配线上精确地按顺序学习特定任务。

在交付管理系统中，强化学习可用于在不同路线的不同车辆之间划分客户的订单，以到达目的地。

在金融行业中，强化学习用于评估实现金融目标的交易策略。

大多数时候，这些强化学习算法与深度学习算法集成在一起，以创建可以处理更复杂任务的深度强化学习算法。

强化学习在人工智能中的作用

人工智能研究的最重要方面之一是强化学习领域。深度学习使AGI能够发现隐藏的模式以建立联系，而强化学习使AGI可以进行抽象以理解模式背后的含义并进而指导行为。

在深度强化学习中将深度学习与强化学习相结合时，AGI可以计划，理解和制定应采取的行动。

DeepMind的MuZero算法就是一个例子，它是一种深度强化学习算法，能够构造代理，这些代理可以在不知道规则的情况下计划如何下棋和下棋。

这是人工智能的第一步。

如果AI可以使用有限的数据来计划，理解和制定行动计划，而无需明确地“教导”，那么AI就会更接近实现通用情报。

结论

在未来，我们可能会看到深度强化学习算法在不同行业中的更多应用。这是一个令人兴奋的时刻。随着不同行业中的许多应用，这些算法的使用将变得更加普遍和复杂。通过大量的研究和应用迭代，我们可以真正看到有一天可能实现通用智能的AI的潜力。

标签：

机器学习强化学习

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇避免机器学习“不良结果”的框架

下一篇研究人员报告“分布式深度学习”取得突破

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

最好的基于Transformer的LLM（上）

最好的基于Transformer的LLM（下）

openwebtext glue shunk031/JGLUE piqa wikitext sciq EleutherAI/lambada_openai facebook/flores

AI热点

行业学习机器学习公司板人工智能未来人工智能机器人视觉识别

AI工具

更多工具 »

ChatGPT

OpenAI旗下AI对话工具

火山写作

字节跳动旗下团队推出的免费AI英语写作助手

Midjourney

AI图像和插画生成工具，测试测试测试测试测试测测试

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub Copilot

GitHub AI编程工具

热门企业

更多企业 »

百度AI

热门职位

更多职位 »

深度学习软件工程师

Maluuba

20000~40000/月

Unity技术经理

Cisco

25000~30000/月深圳市

高级数据分析工程师

PilotAILabs

30000~60000/年深圳市