GAN卷土重来:10亿参数的GigaGAN效果堪比扩散模型

2023-04-21 22:21:20 来源:程序员客栈


(资料图片)

点蓝色字关注“机器学习算法工程师”

设为星标,干货直达!

自从 DALL·E 2 之后,在图像生成方面扩散模型替代GAN成了主流方向,比如开源的文生图模型stable diffusion也是基于diffusion架构的。近日, Adobe研究者在论文Scaling up GANs for Text-to-Image Synthesis提出了参数量为10亿(1B)的GAN模型:GigaGAN,其在文生图效果上接近扩散模型效果,而且推理速度更快,生成512x512大小图像只需要0.13s,生成16M像素图像只需要 3.66s。同时GigaGAN也支持latent空间的编辑功能,比如latent插值,风格混合,以及向量运算等。

GigaGAN改进了StyleGAN架构,采用两阶段训练策略:一个是64x64的图像生成器和一个512x512的图像超分2器,其图像生成器架构如下所示(这里也是采用CLIP text encoder来引入text condition):GigaGAN在 LAION2B-en和 COYO-700M数据集上训练,其在COCO数据集上的FID达到9.09,超过stable diffusion 1.5,推理速度比stable diffusion快20倍多(2.9s vs 0.13s):GigaGAN除了文生图能力,还可以实现可控的合成,比如风格混合,如下图所示:更多效果图和技术细节见论文https://arxiv.org/abs/2303.05511和网站https://mingukkang.github.io/GigaGAN/
标签:

即时看!4月19日淄博德合氯化钾价格暂稳

2023-04-21 04:17:02

全球信息:美国童工问题愈演愈烈 美媒:白宫“不想知道”

2023-04-21 03:52:30

世界资讯:《中国农业展望报告(2023—2032)》发布:预计今年全国食用植物油自给率稳步提高

2023-04-21 03:25:51

也门萨那踩踏事件已造成至少80人死亡 涉事商人被逮捕 最新快讯

2023-04-21 03:13:11

2023年4月20日港币兑换卢布汇率查询 天天热议

2023-04-21 02:51:45

韩国研究从苏丹撤侨方案 考虑投入军用运输机 速看料

2023-04-21 02:36:21

全球消息!4月20日基金净值:鹏华丰收债券最新净值1.021,涨0.59%

2023-04-21 02:31:13

当前热讯:2023珠海香洲区毕业生实习补贴申报指引(时间+条件+方式)

2023-04-21 01:21:27

投身地方优势特色产业:同学,毕业了考虑一起去养羊吗?

2023-04-21 01:20:52

亚洲文化遗产保护联盟大会将在西安召开,已有21个国家确认参会

2023-04-21 00:47:44

石景山区卫健委加强医疗卫生机构安全检查

2023-04-21 00:17:18

辽宁队将大胜北京队晋级半决赛,莫兰德统治篮板,郭艾伦突破致胜 焦点热议

2023-04-21 00:00:50

【世界播资讯】中国轨道交通装备收获拉美市场好评 交通轨道设备行业市场分析2023

2023-04-20 23:53:41

世界即时:英雄x英雄_关于英雄x英雄的简介

2023-04-20 23:01:54

【环球新视野】捡拾幸福_幸福是什么作文600字 遇见_中考满分作文600字

2023-04-20 22:56:07
x 广告
x 广告

Copyright @  2015-2022 时代晚报网版权所有  备案号: 浙ICP备2022016517号-21   联系邮箱: 514 676 113@qq.com