Maluuba：人们的专业知识使人工智能更强大

2019年04月30日由平安发表 319591 0

随着对将人工智能用于更多场景的需求不断增长，微软的科学家和产品开发人员开创了一种称为机器教学的互补方法。这依赖于人们的专业知识将问题分解为更简单的任务，并为机器学习模型提供有关如何更快找到解决方案的重要线索。这就像教一个孩子如何打本垒打，首先把球放在球座上，然后投出一个下手投球，最后转向快速球。

微软企业人工智能总经理Mark Hammond表示：“当我们用人的话来谈论这个问题时，这感觉非常自然和直观，但是当我们转向机器学习时，每个人的心态，不管他们是否意识到，都是‘让我们向系统扔快球’。”“机器教学是一套帮助你停止这样做的工具。”

机器教学旨在从人身上获取知识，而不是仅仅从数据中提取知识。一个了解手头任务的人无论是如何决定公司的哪个部门应该收到一封邮件，还是如何自动定位风力涡轮机以产生更多的能量，首先会将问题分解成更小的部分。然后，他们将提供有限数量的例子，或相当于课程计划，以帮助机器学习算法解决它。

在有监督的学习场景中，当机器学习算法的培训数据很少或没有标签时，机器教学尤其有用，因为行业或公司的需求非常具体。

在困难和模糊的强化学习场景中，算法难以确定在物理世界中掌握任务应该采取的数百万可能的行动，机器教学可以大大缩短智能代理找到解决方案所需的时间。

这也是更广泛的目标的一部分，使更广泛的人群能够使用AI。机器教学允许具有很少AI专业知识的开发人员或主题专家（例如律师，会计师，工程师，护士或叉车操作员）将重要的抽象概念传递给智能系统，然后智能系统在后台执行机器学习机制。

近十年前，微软研究人员开始探索机器教学原理，这些概念现在正在逐步应用于帮助企业构建从智能客户服务机器人到自动系统的各种产品。

“即使是最聪明的人工智能也会自己努力学习如何完成现实世界中常见的一些非常复杂的任务。因此，你需要一种这样的方法，让人们引导人工智能系统学习我们已经知道的事情，“微软企业AI副总裁Gurdeep Pall说。“采用AI并让非专家用它来完成更复杂的任务，这真的是机器教学的最佳选择。”

今天，如果我们正在尝试教一种机器学习算法来了解一张桌子是什么，我们可以很容易地找到一张带有经过精心标记的桌子，椅子和灯具图片的数据集。在将算法暴露给无数标记的示例之后，它学会识别表的特征。

但如果你不得不教一个人如何识别一张桌子，你可能会先解释它有四条腿和一个平顶。如果你看到这个人也将椅子放在那个类别中，你会进一步解释说椅子有一个椅子而一张桌子没有。这些抽象和反馈循环是人们学习方式的关键，也可以增强传统的机器学习方法。

“如果你可以向别人传授一些东西，你应该能够使用与人类学习方式非常接近的语言将其教授给机器，” 微软杰出工程师Patrice Simard说道，他是该公司微软研究院机器教学工作的先驱。本月，他的团队转到体验和设备小组继续这项工作，并进一步将机器教学与对话AI产品相结合。

数百万潜在的AI用户

当Simard注意到机器学习会议上的几乎所有论文都专注于在精心策划的基准测试中提高算法的性能时，他首先开始考虑构建AI系统的新范例。但在现实世界中，他意识到，教学是一个同等或可以说是更重要的学习组成部分，特别是对于有限数据可用的简单任务。

如果你想教一个人工智能系统如何选择最好的汽车，但只有一些被标记为“好”和“坏”的例子，它可能从有限的信息推断出一辆好车的定义特征是第四它的牌照号码是“2”。AI系统指向你告诉你要考虑的相同特征，汽油里程，安全评级，碰撞测试结果，价格，使算法识别好车和坏车尽管标签示例的可用性有限，但也是正确的。

在有监督的学习场景中，机器教学通过识别这些高级有意义的特征来改进模型。与编程一样，机器教学的艺术也涉及将任务分解为更简单的任务。如果不存在必要的功能，则可以使用使用较低级别功能的子模型创建它们，并且这些子模型足够简单。如果系统始终犯同样的错误，可以通过添加功能或示例来消除错误。

采用机器教学概念的首批Microsoft产品之一是语言理解，这是Azure认知服务中的一种工具，可以从短文本中识别意图和关键概念。它已被UPS和Progressive Insurance等公司用于Telefonica开发智能客户服务机器人。

“要了解客户是否对结算或服务计划有疑问，您无需向我们提供问题的每个示例。您可以提供四个或五个，以及该领域中重要的功能和关键字，语言理解负责后台的机制，“ 负责语言理解的首席软件工程经理Riham Mansour说。

微软研究人员正在探索如何将机器教学概念应用于更复杂的问题，例如对更长的文档，电子邮件甚至图像进行分类。他们还致力于使教学过程更加直观，例如向用户建议哪些功能对解决任务可能很重要。

想象一下，公司希望使用人工智能来扫描去年的所有文件和电子邮件，以了解有多少报价被发出以及有多少报价。

作为第一步，系统必须知道如何从合同或发票中识别报价。通常情况下，没有针对该类任务的标记培训数据，特别是如果公司中的每个销售人员处理它有点不同。

如果系统使用传统的机器学习技术，公司将需要外包该过程，发送数千个样本文档和详细说明，以便大量人员可以尝试正确标记它们，这个过程可能需要数月来回消除错误并找到所有相关的例子。他们还需要一个对需求量很大的机器学习专家来构建机器学习模型。如果新的销售人员开始使用系统未经过培训的不同格式，则模型会混淆并停止运行。

相比之下，微软的机器教学方法将使用公司内部的人来识别报价中常见的定义特征和结构：销售人员发送的东西，外部客户的名字，“报价单”或“交货日期”等字样，“”产品，“数量”或“付款条款”。

它会将该人的专业知识转化为机器可以理解的语言，并使用已经预先选择执行该任务的机器学习算法。这可以帮助客户利用其组织中已有的专业知识，在很短的时间内构建定制的AI解决方案。

Pelton指出，世界上有无数人“理解他们的业务并能描述重要的概念。一位律师说，'哦，我知道合同是什么样的，我知道传票是什么样的，我可以给你告诉差异的线索。'“

使难题真正可以解决

十多年前，Hammond在耶鲁大学神经科学实验室担任系统程序员，并注意到科学家如何使用逐步的方法来训练动物进行学习。他有一个关于借用这些课程来教授机器的类似的方法。

它将机器教学与深度强化学习和模拟相结合，帮助公司开发“大脑”，在机器人和制造，能源和建筑管理等应用中运行自主系统。该平台使用名为Inkling的编程语言来帮助开发人员甚至主题专家分解问题并编写AI程序。

深度强化学习是AI的一个分支，其中算法通过基于奖励系统的反复试验来学习，已经成功地超越了视频游戏中的人。但Hammond说，这些模型一直在努力掌握更复杂的现实世界工业任务。

Hammond说，添加机器教学层或将组织独特的主题专业知识直接融入深层强化学习模型，可以大大减少为这些极为复杂的现实问题找到解决方案所需的时间。

例如，假设一家制造公司希望培训AI代理，以便自动校准一个关键设备，当温度或湿度波动或在使用一段时间后，这些设备可能会被抛弃。一个人可以使用Inkling语言创建“课程计划”，该计划概述执行任务的相关信息并监视系统是否运行良好。

借助其机器教学组件中的信息，Bonsai系统将选择最佳的强化学习模型并创建AI“大脑”，通过自动校准设备来减少昂贵的停机时间。它将测试模拟环境中的不同操作，并根据执行校准的速度和精确程度进行奖励或惩罚。

Hammond说，告诉人工智能大脑一开始就关注重要的事情可以缩短许多无效和耗时的探索，因为它试图在模拟中学习什么有效和无效。

“机器教学证明至关重要的原因是因为如果你只是天真地使用强化学习并且不给它任何关于如何解决问题的信息，那么它将随机探索并且可能希望，但通常不会让解决方案这很有效，“Hammond说。“它使问题真正可以解决，而没有机器教学则不然。”

标签：

行业 Maluuba

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇成为数据科学家必读的3本机器学习书籍

下一篇 DataRobot庆祝其云平台上建立的10亿个模型

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

最好的基于Transformer的LLM（上）