新的厨师数据集将AI引入烹饪
2023年07月06日 由 Camellia 发表
176902
0
人工智能可以帮助人们购物、规划和写作,但不能烹饪。事实证明,并不是只有人类很难按照正确的顺序遵循逐步的食谱,佐治亚理工学院计算学院的新研究可能会改变这一现状。
[caption id="attachment_54827" align="aligncenter" width="800"]
烹饪教学对话任务的对话片段,其中有好的和不好的系统响应,以及每个不好的响应的相应错误类型。资料来源:arXiv(2023)。[/caption]
研究人员创建了一个名为ChattyChef的数据集,该数据集使用自然语言处理模型,可以帮助用户根据食谱进行烹饪。使用开源的大型语言模型GPT-J,ChattyChef的烹饪对话数据集可以跟随用户的食谱。
研究人员在论文《改进的食谱对话指令排序》中介绍了他们的人工智能,该论文在第61届计算语言学协会年会上发布,并且还在arXiv预印版服务器上发表。
尽管其他研究人员已经对AI厨师的可能性进行了理论探讨,但佐治亚理工学院的工作推动了该领域的进展。交互式计算学院的博士生Duong Le说:“我们是首批分析使用大型语言模型构建AI厨师的挑战的研究团队之一。”
大多数使用语言模型进行烹饪的尝试都失败了,因为GPT-J不理解用户意图或者用户下一步想做什么,并且很难追踪用户在食谱中进行到哪一步,这是研究人员所称的“对话状态”。它还不能轻松回答具体问题,例如有关食材数量或烹饪时间的问题。
例如,也许有人想做土豆饼。人工智能告诉他们在锅里融化黄油并加入土豆。然后用户询问下一步该怎么做。一个糟糕的机器人可能会搞混淆订单,告诉他们提供土豆饼,尽管他们还没有熟。或者用户提出关于煎土豆饼时间多长的后续问题,人工智能可能不会给出准确的时间,而是给出一个整体的时间,而不具体说明每一面的烹饪时间。
鉴于这一点,研究人员确保他们的模型具有两个关键功能:
1.用户意图检测,确定用户在一系列事先确定的可能性中的当前意图,例如“询问下一步指令”或“询问有关食材的细节”。
2.指令状态跟踪,确定用户所在的食谱步骤,准确率为80%。
这些功能的综合信息支持ChattyChef的第三个创新——响应生成。用户意图有助于生成最佳响应,以回答用户的问题。指令状态选择最相关的食谱部分,而不是包含整个食谱,以避免让用户混淆或产生额外的步骤负担。
ChattyChef数据集是基于正面评分的WikiHow食谱构建的,并且步骤少于八步。研究人员通过众包人员扮演使用ChattyChef的角色,以确定在数据集中包含哪些最佳指令。
研究人员认为,ChattyChef的创新可以在除了烹饪之外的许多领域中使用,比如维修手册或软件文档。
来源:https://techxplore.com/news/2023-07-chef-dataset-ai-cooking.html