深度学习系统根据食谱自动生成食物图像

登录注册

行业学习

支撑

数据算量系统

企业招聘

下载

模型数据集

AI工具箱

企业服务

EVA 智能HR

ChatGPT 人工智能应用人工智能未来计算机视觉

热门新闻

公司板科大讯飞

科大讯飞包揽ICPR MTWI图文识别挑战赛三项冠军

行业人工智能

所以，能动手就别吵吵了

行业人工智能

人工智能对 IT 技能和人才发展的影响

常用工具

ChatGPT

OpenAI旗下AI对话工具

火山写作

字节跳动旗下团队推出的免费AI英语写作助手

Midjourney

AI图像和插画生成工具，测试测试测试测试测试测测试

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub Copilot

GitHub AI编程工具

您尚未登录账户

请先登录您的atyun账户，方可使用该功能

仅限企业账户使用

该功能仅限企业账号使用，开通企业账号可享受更多服务，是否现在注册企业账号？

立即注册企业账号

暂不需要

您的企业账号申请正在审核中

审核通过后即可使用此功能，请耐心等待~

2019年01月16日由浅浅发表 291606 0

对于计算机视觉，通过一长串文本创建图像是复杂的。为了加速这一领域的研究，以色列特拉维夫大学的一个团队开发了一个基于深度学习的系统，该系统可以通过简单的基于文本的食谱自动生成食物的图片。

研究人员在他们的论文中指出：“我们提出了一项新的任务，即通过长文本生成图像，这与图像有关，但不包含对图像的直观描述。”

团队使用NVIDIA TITAN X GPU，以及cuDNN加速的 PyTorch深度学习框架，用52000个食谱及其相应的图像训练了GAN。经过训练后，系统从一长串没有描述视觉内容的文本中生成菜谱的图像。

研究者之一Ori Bar El表示，食谱作为输入，系统从头开始生成它认为该食谱描述的食物的图像。

重要的一点是，系统无法访问菜谱的标题，否则这项任务将非常简单，而且菜谱的文本很长，不能直接描述图像的视觉内容。这使得这项任务即使对人类来说也非常困难，对计算机来说更是如此。

深度学习系统根据食谱自动生成食物图像

为了评估系统产生的两种方法的图像，该团队利用人类评论者的帮助，以1到5的等级判断最具吸引力的图像。值得一提的是，一些真实的食物图像排名低于生成的图像。

该系统成功生成类似粥的食物图像，包括意大利面，米饭，汤和沙拉，但很难生成具有独特形状的图像，如汉堡包，鸡肉或饮料。

论文：

arxiv.org/pdf/1901.02404.pdf

标签：

视觉识别图像识别

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇高尔夫球还是茶壶？神经网络能否通过形状正确识别物体

下一篇外媒称2019的中国人脸识技术将在全球扩展

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

最好的基于Transformer的LLM（上）