Google研究人员推出了一种用于生成文本到图像的新框架(TReCS)

Stella981
• 阅读 735

Google研究人员推出了一种用于生成文本到图像的新框架(TReCS)

基于生成对抗网络(GAN)的深度神经网络促进了端到端可训练的照片级逼真的文本到图像的生成。许多方法还使用中间场景图表示法来改善图像合成。使用基于对话的交互的方法允许用户提供指令,以逐步改进和调整生成的场景。通过指定背景中对象的相对位置,可以为用户提供更好的控制。但是上述方法中使用的语言受到限制,并且生成的图像仅限于合成3D可视化效果或卡通。

为了创建能够在任何语言对之间进行翻译的通用神经机器翻译系统,一组Google研究人员开发了一种新的框架,即标签检索,合成综合系统(TReCS)。所提出的方法通过改进语言唤起图像元素的方式以及迹线如何通知其位置,从而显着增强了图像生成过程。该系统接受了超过250亿个示例的训练,具有处理103种语言的潜力。其功能使鼠标轨迹与文本描述对齐,并为提供的短语创建可视标签。

  • 新框架利用可控的鼠标轨迹作为细粒度的视觉基础,根据用户的叙述生成高质量的图像。标记器用于预测短语中每个单词的对象标签。

  • 文本到图像的双重编码器使用语义相关的掩码检索图像。对于每个迹线序列,选择一个遮罩以最大化空间重叠,从而克服了真实的文本到对象信息和更好的地面描述。

  • 选定的蒙版根据跟踪顺序组成,并为背景和前景对象使用单独的画布。将前景蒙版放置在背景蒙版上以创建完整的场景分割。

  • 最后,通过将整个分割输入到蒙版到图像的转换模型中来合成逼真的图像。

Google研究人员推出了一种用于生成文本到图像的新框架(TReCS)

在评估方面,新系统在自动和人工判断下均优于SOTA文本图像生成技术。它显示了从日常演讲中翻译的嘈杂叙事中的复杂文本生成逼真的可控照片的可行性。TReCS系统解决了冗长而复杂的文本描述生成文本图像的复杂性。所提出的方法表明,鼠标跟踪可以成为生成实际文本图像的有用来源。

局限性:

该研究的局限性之一是缺乏合适的评估指标来定量测量生成的图像的质量。现有的度量标准不能合理地反映出真实图像与机器生成的图像之间的语义相似性。

在未来几年中,提出的想法可以支持提供友好的人机界面的各种应用程序。它可以帮助艺术家创建原型,从机器生成的照片中汲取见解并生成逼真的图像。此外,它还可用于设计人在环评估系统以优化网络。

论文:

https://arxiv.org/pdf/2011.03775.pdf

Google研究人员推出了一种用于生成文本到图像的新框架(TReCS)

推荐阅读

谷歌Waymo CEO:特斯拉「根本不是竞争对手」,马斯克表震惊!

Google研究人员推出了一种用于生成文本到图像的新框架(TReCS) 点击“阅读原文”图书配套资源

本文分享自微信公众号 - 相约机器人(xiangyuejiqiren)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

点赞
收藏
评论区
推荐文章
blmius blmius
3年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
Easter79 Easter79
3年前
swap空间的增减方法
(1)增大swap空间去激活swap交换区:swapoff v /dev/vg00/lvswap扩展交换lv:lvextend L 10G /dev/vg00/lvswap重新生成swap交换区:mkswap /dev/vg00/lvswap激活新生成的交换区:swapon v /dev/vg00/lvswap
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
待兔 待兔
4个月前
手写Java HashMap源码
HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程22
Jacquelyn38 Jacquelyn38
3年前
2020年前端实用代码段,为你的工作保驾护航
有空的时候,自己总结了几个代码段,在开发中也经常使用,谢谢。1、使用解构获取json数据let jsonData  id: 1,status: "OK",data: 'a', 'b';let  id, status, data: number   jsonData;console.log(id, status, number )
Stella981 Stella981
3年前
Android So动态加载 优雅实现与原理分析
背景:漫品Android客户端集成适配转换功能(基于目标识别(So库35M)和人脸识别库(5M)),导致apk体积50M左右,为优化客户端体验,决定实现So文件动态加载.!(https://oscimg.oschina.net/oscnet/00d1ff90e4b34869664fef59e3ec3fdd20b.png)点击上方“蓝字”关注我
Easter79 Easter79
3年前
Twitter的分布式自增ID算法snowflake (Java版)
概述分布式系统中,有一些需要使用全局唯一ID的场景,这种时候为了防止ID冲突可以使用36位的UUID,但是UUID有一些缺点,首先他相对比较长,另外UUID一般是无序的。有些时候我们希望能使用一种简单一些的ID,并且希望ID能够按照时间有序生成。而twitter的snowflake解决了这种需求,最初Twitter把存储系统从MySQL迁移
Wesley13 Wesley13
3年前
mysql设置时区
mysql设置时区mysql\_query("SETtime\_zone'8:00'")ordie('时区设置失败,请联系管理员!');中国在东8区所以加8方法二:selectcount(user\_id)asdevice,CONVERT\_TZ(FROM\_UNIXTIME(reg\_time),'08:00','0
Python进阶者 Python进阶者
10个月前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这
生成对抗网络GAN简介
生成对抗网络(GenerativeAdversarialNetworks,GAN)是一种深度敏感词模型,用于生成具有高度逼真度的新数据,如图像、音频、文本等。GAN是由IanGoodfellow等人在2014年提出的,其核心思想是通过两个神经网络,即生成器和判别器,相互竞争和协作来实现数据生成的目的。GAN的基本框架和训练过程如下图所示: