亚马逊提出新的表征方法,使Alexa的技能选择错误率降低了40%
2018年12月19日 由 浅浅 发表
113142
0
亚马逊的研究人员通过使用新颖的数据表征技术,成功地提高了Alexa选择第三方应用程序的能力。在博客文章和随附的论文“Coupled Representation Learning for Domains, Intents and Slots in Spoken Language Understanding”中,Alexa AI部门的亚马逊科学领导者Young-Bum Kim和团队描述了一个为自然语言任务设计的方案,可以将Alexa的技能选择错误率降低40%。
该研究将在本月晚些时候在希腊雅典举行的IEEE口语技术会议上展示。Kim表示,“近年来,数据表示已成为机器学习中的一个重要研究课题,例如,自然语言理解(NLU)系统很少将原始文本作为输入。相反,它们采用嵌入,数据表示来保留关于文本的语义信息,但是以一致的,形式化的方式来呈现。并且一次又一次地使用嵌入而不是原始文本来提高特定NLU任务的性能。”
新的表征方法利用了Alexa处理请求的方式。正如Kim解释的那样,Alexa首先按照主题区域或域名(例如音乐或天气)对请求进行分类,然后按意图或预期行动对请求进行分类。它们根据定义Alexa如何识别和处理数据的实体的插槽类型重新分类。(例如,使用actor插槽类型的技能可能会根据提供的演员的名称查询影片集锦。)
Kim和共同作者利用自然的分类层次来构建一个AI模型,该模型可以生成插槽表征,意图表征和域表征。这是一个多步骤的过程。
首先,话语通过“de-lexicalizer”,将通用插槽名称替换为插槽值。这些插槽值移动到嵌入层,将它们转换为矢量,使具有相似含义的单词聚集在一起。之后,将嵌入传递给双向长期短期记忆(LSTM)网络。研究人员用涵盖17个领域的246000种表达训练了AI系统。
为了测试其精确度,他们使用其编码作为两阶段技能选择系统的输入。根据Kim的说法,在实验中,它不仅将准确度从90%提高到94%,而且还超越了他们自己设计的三个类似系统。
Kim表示,“我们在技能选择的重要任务上测试我们的方案,根据成千上万的客户要求确定Alexa技能。我们发现我们的方案大大降低了技能选择错误率,这有助于客户与Alexa的互动更加自然,并且令人满意。”
博客:developer.amazon.com/zh/blogs/alexa/post/4a37e694-fc8d-4336-a785-126041879e7e/with-new-data-representation-scheme-alexa-can-better-match-skills-to-customer-requests
论文:s3.us-east-2.amazonaws.com/scienceblogmediafiles/Coupled+Representation+Learning.pdf