热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

这些假脸实在太逼真了!英伟达造出新一代GAN,生成壁纸级高清大图毫无破绽...

栗子晓查发自凹非寺量子位报道|公众号QbitAI不敢相信,上面这些人脸,全都是假的。是英伟达的AI生成的。借用风格迁移的思路,团队为GAN
栗子 晓查 发自 凹非寺 
量子位 报道 | 公众号 QbitAI

640?wx_fmt=png

不敢相信,上面这些人脸,全都是假的。

是英伟达的AI生成的。

借用风格迁移的思路,团队为GAN创造了一种新的生成器

连GAN之父Goodfellow老师也忍不住发推称赞优秀!

640?wx_fmt=png

这个结构不需要人类监督,可以自动分离图像中的各种属性。这样,在或粗糙或精细的不同尺度上,人类便能自如地控制GAN的生成。

另外,英伟达的人脸生成模型,支持1024 x 1024的高清大图生成。毕竟,GAN从小吃的是高清数据集。团队还说,数据集很快就要开源了。

实际效果展示

640?wx_fmt=gif

人物自然,背景自然,边缘又自然。足以骗过我这个普通人类的肉眼了。

输入两张图,图A决定生成人物的性别,年龄,头发长度,以及姿势;一张决定其他一切因素:比如肤色、发色、衣服颜色等等。

这样,就可以把图B的一部分人物特征,迁移到图A上了:

640?wx_fmt=gif

不过,人脸的朝向和表情,还是A的。

就算人种发生剧烈变化,也丝毫不会违和。你看,把非裔人类的脸部特征“移植”给四位白种人,嘴唇的厚度、鼻子的形态,以及额头,都有明显的变化。

640?wx_fmt=gif

再来看看从不同尺度调节的效果吧。

这是粗糙尺度 (Coarse Styles) ,也是三种尺度中最大规模的调整,会涉及脸部朝向的变化,脸型和发型也是在这里调整的:

640?wx_fmt=gif

然后看看中间尺度 (Middle Styles) ,调整仅限于面部特征和发色发量了,姿势、发型、脸型都不会有明显变化:

640?wx_fmt=gif

再来就是精细尺度 (Fine Styles) ,只是调整图像的配色,几乎不会给人物变脸了:

640?wx_fmt=gif

全新的生成器

我们前面说过,这个GAN不用人类监督,就可以自动分割图像里的各种部分。

经过训练,它就可以把这些部分,按照一定的方式组合到一起。

具体怎么组合呢:

这种新的生成器,像风格迁移算法一样,把一张图像,看做许多风格 (Styles) 的集合。

每种风格都会在一个不同的尺度 (Scale) 上控制图像的效果:

粗糙 (Coarse Styles) :姿势、头发、脸型。

中度 (Middle Styles) :面部特征、眼睛。

精细 (Fine Styles) :配色。

三者组合在一起,才是最终的生成结果。

调节不同“风格”,就可以在不同尺度上调节人脸图片。

640?wx_fmt=png

另外,这只GAN还可以自动把那些无关紧要的变化 (Inconsequential Variation) 剔除出去。

所谓无关紧要,就是说画面发生了变化,但看上去主角还是原来的主角。

粗糙的噪音:如大尺度上的卷发程度。

精细的噪音:更加精细的细节,如质地等。

无噪音:没有特征的、像画画一样的样子 (Featurelessly “painterly” look) 。

640?wx_fmt=png

相同图片,输入不同的噪音,效果就不一样。

人类也可以选择,每种Style的强度 (Strength) 多大。

选择高强度 (High Strength) 的话,生成的图像就会比较多样化,但生成坏图也会有一些。

如果是低强度 (Low Strength) ,生成的图像之间不会有太多变化,但也几乎不会出现坏图。

从结构上来看,这个新的生成器是这样的:

640?wx_fmt=png

传统的图像生成器仅通过输入层提供潜在编码(Latent Code),英伟达从一开始就舍弃了这种设计方案。

就像上图展示的那样,他们设计的新生成器先将输入从潜在空间Z映射到中间的潜在空间W,将映射网络生成结果输入到下一层。在生成网络g每次卷积运算之后,加入高斯噪声(Gaussian noise),也就是图像的随机变化。

图像在不同尺度上的“风格”,就是由上面的每个卷积层控制的,它实现了直接控制各层级的图像特征强度(Strength)。

从生成图像中的随机自动变化中。它可以无监督地从中分离出图像的“风格”。

发布更强人脸数据集

除了发布图像生成算法外,英伟达从Flickr中选取了7万张1024×1024分辨率的照片,形成了一个新的人脸数据集FFHQ(Flickr-Faces-HQ)。

640?wx_fmt=png

它能提供了高度多样化、高质量的人脸数据,并且涵盖了比现有高分辨率数据集(如CelebA-HQ)更多的变化,比如更多佩戴眼镜、帽子的照片。

英伟达将在不久后公开提供此数据集,并放出源代码和预训练网络。

最后,给广大猫奴们送出福利。英伟达的图片生成器不仅能用于人脸,研究人员还用LSUN数据集造出了很多猫咪的图片。

640?wx_fmt=jpeg

你能看出它们都是假的吗?

传送门

论文地址:
https://arxiv.org/pdf/1812.04948.pdf

源代码和人脸数据不久后将放出:
http://stylegan.xyz/code

活动报名

640?wx_fmt=jpeg

加入社群

量子位AI社群开始招募啦,欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“交流群”,获取入群方式;


此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。


进专业群请在量子位公众号(QbitAI)对话界面回复关键字“专业群”,获取入群方式。(专业群审核较严,敬请谅解)

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

640?wx_fmt=jpeg

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态





推荐阅读
  • 微软头条实习生分享深度学习自学指南
    本文介绍了一位微软头条实习生自学深度学习的经验分享,包括学习资源推荐、重要基础知识的学习要点等。作者强调了学好Python和数学基础的重要性,并提供了一些建议。 ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • sklearn数据集库中的常用数据集类型介绍
    本文介绍了sklearn数据集库中常用的数据集类型,包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集,包含了波士顿506处房屋的13种不同特征以及房屋价格,适用于回归任务。 ... [详细]
  • Iamtryingtomakeaclassthatwillreadatextfileofnamesintoanarray,thenreturnthatarra ... [详细]
  • 在Android开发中,使用Picasso库可以实现对网络图片的等比例缩放。本文介绍了使用Picasso库进行图片缩放的方法,并提供了具体的代码实现。通过获取图片的宽高,计算目标宽度和高度,并创建新图实现等比例缩放。 ... [详细]
  • 本文介绍了brain的意思、读音、翻译、用法、发音、词组、同反义词等内容,以及脑新东方在线英语词典的相关信息。还包括了brain的词汇搭配、形容词和名词的用法,以及与brain相关的短语和词组。此外,还介绍了与brain相关的医学术语和智囊团等相关内容。 ... [详细]
  • 本文介绍了设计师伊振华受邀参与沈阳市智慧城市运行管理中心项目的整体设计,并以数字赋能和创新驱动高质量发展的理念,建设了集成、智慧、高效的一体化城市综合管理平台,促进了城市的数字化转型。该中心被称为当代城市的智能心脏,为沈阳市的智慧城市建设做出了重要贡献。 ... [详细]
  • CSS3选择器的使用方法详解,提高Web开发效率和精准度
    本文详细介绍了CSS3新增的选择器方法,包括属性选择器的使用。通过CSS3选择器,可以提高Web开发的效率和精准度,使得查找元素更加方便和快捷。同时,本文还对属性选择器的各种用法进行了详细解释,并给出了相应的代码示例。通过学习本文,读者可以更好地掌握CSS3选择器的使用方法,提升自己的Web开发能力。 ... [详细]
  • 本文主要解析了Open judge C16H问题中涉及到的Magical Balls的快速幂和逆元算法,并给出了问题的解析和解决方法。详细介绍了问题的背景和规则,并给出了相应的算法解析和实现步骤。通过本文的解析,读者可以更好地理解和解决Open judge C16H问题中的Magical Balls部分。 ... [详细]
  • 也就是|小窗_卷积的特征提取与参数计算
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了卷积的特征提取与参数计算相关的知识,希望对你有一定的参考价值。Dense和Conv2D根本区别在于,Den ... [详细]
  • 本文介绍了机器学习手册中关于日期和时区操作的重要性以及其在实际应用中的作用。文章以一个故事为背景,描述了学童们面对老先生的教导时的反应,以及上官如在这个过程中的表现。同时,文章也提到了顾慎为对上官如的恨意以及他们之间的矛盾源于早年的结局。最后,文章强调了日期和时区操作在机器学习中的重要性,并指出了其在实际应用中的作用和意义。 ... [详细]
  • This article discusses the efficiency of using char str[] and char *str and whether there is any reason to prefer one over the other. It explains the difference between the two and provides an example to illustrate their usage. ... [详细]
  • Java 11相对于Java 8,OptaPlanner性能提升有多大?
    本文通过基准测试比较了Java 11和Java 8对OptaPlanner的性能提升。测试结果表明,在相同的硬件环境下,Java 11相对于Java 8在垃圾回收方面表现更好,从而提升了OptaPlanner的性能。 ... [详细]
  • Android自定义控件绘图篇之Paint函数大汇总
    本文介绍了Android自定义控件绘图篇中的Paint函数大汇总,包括重置画笔、设置颜色、设置透明度、设置样式、设置宽度、设置抗锯齿等功能。通过学习这些函数,可以更好地掌握Paint的用法。 ... [详细]
author-avatar
飞跃星空2502906253
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有