通过生成表征的自条件图像生成

阅读: 评论:0

通过生成表征的自条件图像生成

通过生成表征的自条件图像生成

摘要

.03701.pdf
本文提出了表示条件图像生成(Representation-Conditioned Image Generation,简称RCG),这是一个简单而有效的图像生成框架,在类别无条件的图像生成中设置了新的基准。RCG不依赖于任何人类标注,而是依赖于一种自监督表示分布,该分布是使用预训练编码器从图像分布中映射出来的。在生成过程中,RCG使用表示扩散模型(Representation Diffusion Model,简称RDM)从这样的表示分布中进行采样,并使用像素生成器根据采样的表示来生成图像像素。这样的设计在生成过程中提供了大量的指导,从而实现了高质量的图像生成。在ImageNet 256×256上进行测试,RCG实现了3.31的Frechet Inception距离(FID)和253.4的Inception分数(IS)。这些结果不仅显著提高了类别无条件图像生成的最新技术水平,而且与当前领先的类别条件图像生成方法相媲美,缩小了这两项任务之间长期存在的性能差距。代码可在。

1、简介

近年来,条件图像生成取得了令人瞩目的成果,利用类别标签或文本描述等人类标注来指导生成过程[11,12,18,22,47,51]。相比之下,省略这种条件元素的无条件图像生成历来是一项更具挑战性的任务,往往产生的效果不那么令人印象深刻[3,18,19,39,43]。

这种二分法与监督学习和无监督学习之间的二分法相似。从历史上看,无监督学习在性能上落后于监督学习。随着自监督学习(SSL)的出现,这一差距有所缩小,它从

本文发布于:2024-01-28 03:05:43,感谢您对本站的认可!

本文链接:https://www.4u4v.net/it/17063823494327.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:表征   图像   条件
留言与评论(共有 0 条评论)
   
验证码:

Copyright ©2019-2022 Comsenz Inc.Powered by ©

网站地图1 网站地图2 网站地图3 网站地图4 网站地图5 网站地图6 网站地图7 网站地图8 网站地图9 网站地图10 网站地图11 网站地图12 网站地图13 网站地图14 网站地图15 网站地图16 网站地图17 网站地图18 网站地图19 网站地图20 网站地图21 网站地图22/a> 网站地图23