游戏电视苹果数码历史美丽
投稿投诉
美丽时装
彩妆资讯
历史明星
乐活安卓
数码常识
驾车健康
苹果问答
网络发型
电视车载
室内电影
游戏科学
音乐整形

英伟达再出黑魔法GauGAN凭借几根线条,草图秒变风景照

  【新智元导读】英伟达再推黑科技GauGAN,这款图像生成软件仅凭用户随意画的线条和色块,就能自动生成逼真的图片,效果堪比风光大片!此番可谓你只管乱画,最后不好看算我输!
  这是网上流传甚广的一个图,教你一步步来画一匹马。
  首先,画两个圈;接着画4条腿、脸;然后画上毛发;最后再加几笔细节就大功告成了
  这张图真实的体现了在通常情况下,学生面对老师传授知识、或者技能时候的一种状态。很多人对此深有同感:在大牛口中简单加几笔细节的操作,在凡人看来无异于直接从新手跳到王者。但这种情况正在改变,手残党也可以画出逼真的风光大片了!这完全要感谢英伟达最新推出的一款黑科技。
  英伟达在GTC2019上推出了一个令人惊叹的图像生成器。它使用生成对抗性网络(GAN),用户只需点击几下即可绘制出近乎真实的图像。该软件能够立即将几行草草勾勒的轮廓图,变成华丽的山顶日落图景。
  我们先来看一个动图:
  图中,左边是人类操作员画的,右边是AI直接简单加上几笔细节后生成的。在普通人看来,右边的图像几乎毫无破绽,看不出这并非一张风光照片,而是AI生成的虚拟海滩。
  让我们再来看几张动图,来更深刻的体会一下:
  从图中我们可以看出,GauGAN并不是像Photoshop里贴一个图层那样,简单的把图形贴上去,而是根据相邻两个图层之间的对应关系对边缘进行调整。比如石头在水里的倒影应该是什么样的、被瀑布冲刷的山石应该是怎样的状态、近处的山和远处的山之间的层次应该如何表现
  现在我们放出完整的视频:
  这次,不光设计师、修图师坐不住了,摄影师也坐不住了!英伟达的黑魔法:GauGAN
  他们给这个软件起名叫做GauGAN。这个软件只是对英伟达神经网络平台强大性能的一次证明。这个软件能够将人类的绘画方式和过程进行编译,在几秒钟内就能画出草图,并将其转换为逼真的照片。从软件的早期演示中,它似乎能够做到这一点。
  GauGAN这个词,很容易让人联想到那位和梵高相爱相杀的19世纪著名后印象派绘画大师高更。事实上,GauGAN也确实使用了高更的绘画作品对模型进行训练。
  保罗高更(1848年6月7日1903年5月8日)
  GauGAN目前提供三种工具:颜料桶、钢笔和铅笔。屏幕底部是一系列对象。选择云,并用铅笔画一条线,软件将生成一缕逼真的云。但这些不是固定的图像模板。GauGAN可以根据不同的输入生成独有的结果。画一个圆圈,在用颜料工具填充,可以使生成的云的质感变得更蓬松。
  用户可以使用输入工具勾勒出一棵树的形状,软件就能自动生成一棵树。画一条直线,会产生一个裸露的树干。在顶部画一个灯泡一样的形状,软件将自动用叶子进行填充,生成一棵完整的树。
  利用GauGAN生成一棵树和一条海岸线,注意生成图像的天气变化
  GauGAN是多模式软件。如果有两个用户使用相同的设置,创建了相同的草图,软件中内置的随机数也能确保最终的生成的作品是不同的结果。
  为了获得实时结果,GauGAN必须在Tensor计算平台上运行。Nvidia在RDXTitanGPU平台上进行了演示,生成了实时的输出结果。演示者绘制一条线,软件立即产生了结果。不过,英伟达应用深度学习研究副总裁BryanCatanzaro表示,未来经过一些修改后,GauGAN可以在几乎任何平台上运行,包括CPU上,但生成的结果可能需要几秒钟时间才能显示。
  在演示中,不同对象之间的界限划分还存在一些问题,项目团队表示将会继续改进。两个目标接触的部分会出现很浅的线条。英伟达声称图片生成结果可以像照片一样真实,但仔细看其实达不到这个程度。神经网络目前在训练对象以及训练目标上还存在问题。希望这个项目有助于解决这个问题。
  在训练数据上,英伟达利用Flickr上的100万张图像来训练神经网络。大多数图像来自Flickr的知识共享计划,Catanzaro说表示,该公司仅使用经过的图像。
  英伟达表示,这款软件可以合成数十万个对象及其与现实世界中其他对象的关系。在GauGAN中,如果用户改变季节设置,叶子将从树枝上消失。如果树前有一个池塘,那么这棵树就会在水中反射出来。
  Catanzaro希望这款软件可以在英伟达的新AI游戏平台上使用,但目前要实现这个目标还需要做一些进一步的工作。在视频游戏中使用此类工具可以为用户打造更加身临其境的环境,但是英伟达并没有直接开发这样的软件。
  对于此软件可能被恶意利用来生成虚假图像的问题,Catanzaro同意这是一个重要的问题,可能比一个项目和一个公司更重要。他说,这是一个信任问题,而不是技术问题,社会必须面对和妥善处理这个问题。
  即使在这个有限的演示来看,从视频游戏设计师、到架构师、再到休闲游戏玩家都很容易被这个软件的功能所吸引。目前英伟达没有透露关于将此软件进行商业化发布的任何计划,但预计很快就会发布公开试用版,任何人都可以体验。
  支持该项目的技术论文已经发布。Catanzaro表示,此文已经被CVPR2019接收。
  预印本论文地址:
  https:arxiv。orgpdf1903。07291。pdf
  从论文中可以看出,GauGAN应用软件是基于名为空间自适应归一化技术实现的。论文中对该技术进行了比较系统的介绍,并通过数据集实验表明,该技术在图像内容生成和编辑任务上比以往方法实现了更优秀的表现。而该技术的提出,是由条件图像合成任务开始的。GauGAN背后的秘密:空间自适应条件归一化
  条件图像合成是指在某些输入数据上生成照片级真实图像的任务。早期的方法是通过拼接图像数据库中的片段来计算输出图像。最近则一般使用神经网络直接学习映射。后一种方法通常更快,并且不需要外部图像数据库。
  条件图像合成的特定形式可以将语义分割掩模转换为照片级真实的图像。该技术可以产生广泛的应用,包括内容生成和图像编辑。这种形式称为语义图像合成。通过堆叠卷积,归一化和非线性层构建的传统网络架构达不到最优效果,因为它们的归一化层很可能会带走输入语义掩码中的信息。
  用户可以在合成图像时控制语义和样式。语义(树的存在)通过标签图(在顶行中可视化)来控制,样式可以通过参考图像(最左列)来控制
  为了解决这个问题,我们提出了空间自适应的归一化,这是一种条件归一化,通过空间自适应学习转换使用输入语义布局来调制激活,可以在整个网络中有效地传播语义信息。
  我们将模型在几个具有挑战性的数据集上进行了实验(包括COCOStuff,ADE20K和Cityscapes)。结果表明,在空间自适应归一化层的帮助下,与几种最先进的方法相比,网络的生成结果明显更好了。
  不同数据集上的实验结果对比
  另外,空间自适应归一化对语义图像合成任务的几种变体任务同样有效,而且支持基于多模态和样式的图像合成,能够实现可控的多样化输出,最终呈现了让人惊叹的效果:
  GauGAN的意义
  GauGAN可以为建筑师、城市规划者、景观设计师、游戏开发者、广告设计师等各种和图像相关的职业在创建虚拟世界时提供强大的工具。通过人工智能了解现实世界的外观,这些专业人员可以更好地制作想法原型并快速更改合成场景。
  NVIDIA应用深度学习研究副总裁BryanCatanzaro将GauGAN背后的技术比作智能画笔,可以填充粗略分割图中的细节。粗略分割图是显示场景中物体位置的高级轮廓图,GauGAN允许用户绘制自己的分割图并操纵场景,用沙子,天空,海洋或雪等标签标记每个图形。
  通过对一百万张图像的训练,深度学习模型将填充景观并显示停止结果:在池塘中绘制,并且附近的元素如树木和岩石将在水中出现反射。将片段标签从草交换为雪,整个图像变为冬季场景,以前的绿叶树变得贫瘠。
  这就像一张彩图图片描述了一棵树在哪里,太阳在哪里,天空在哪里,Catanzaro说。然后神经网络能够根据它对真实图像的了解,填充所有的细节和纹理,以及反射,阴影和颜色。
  Catanzaro说:通过简单的草图进行头脑风暴设计要容易得多,而且这种技术能够将草图转换成高度逼真的图像。也就是说,产品设计师可以在头脑风暴的阶段,就直接产出高保真原型;而乙方更是可以在甲方当面提需求的时候,就给出预览效果图。
  但是话又说回来,虽然GauGAN的出现,让我们不需要具备专业的绘画、设计、摄影技能就可以制造出逼真的图像,但它毕竟只是一个帮我们将脑海中的想法实现出来的工具,而非我们大脑本身,如果我们脑海中没有任何想法,它也无法凭空去创造任何东西。
  可以预见的是,基础技能方面的需求正在变得不那么重要,而对更高阶的技能需求(比如创意、审美、洞察)的要求正在变得越来越高。
  参考链接:
  https:techcrunch。com20190318nvidiaaiturnssketchesintophotorealisticlandscapesinseconds
  Github代码资源:
  https:github。comNVlabsSPADE
  论文链接:
  https:arxiv。orgpdf1903。07291。pdf

启辰星定制2021女王副驾宠她一夏今年第6号台风烟花登陆,江浙沪一时风雨如晦。风雨飘摇中,SUV头等舱启辰星如约于7月24日晚,在东风日产直播间发布2021款星享有成版定制车型,官方售价为13。36万元。……营收超百亿市值超千亿,科大讯飞收获人工智能红利文杨剑勇2020年受新冠大流行影响,各界为确保竞争力,以及面对不确定性的未来能实现持续增长,加速了与人工智能等新技术融合驱动数字化、智能化转型,在生产模式、运营模式、产品……8000元限时购升级包汉EV旗舰型抢先体验58月29日,比亚迪在成都车展正式发布5G丹拿智能音乐座舱升级包,售价18000元。在12月31日前,购买汉EV旗舰型的用户,此升级包限时售价仅需8000元,并获赠5G优享VIP……未发布就挨打,iQOO7遭米系最高规格针对昨天黑鲨CEO罗语周在微博发声表示明天有大事发生,网友猜测是新机预热,然而实际确实也是新机预热,不过更多是对友商的针对。在iQOO7发布之前小米系的黑鲨游戏手机和Redmi纷纷……呼伦贝尔宋ProDM可试乘,限时特惠5。89手握购车款犹豫不决的你是不是还在为买车而观望,当前比亚迪益丰祥泰店宋ProDM降价1。0万元颜色可选,现车充足,优惠时间即日起到09月26日,犹豫不决的朋友不妨到店亲身试驾一下……刚刚!员工长期工资5000元以下被查了!2021年,这样发工今年税务稽查与往年最大的区别之一就在于个税方面,而个税的重点就是工资薪金,企业还这样发工资,要小心了!突发,员工工资5000元被查了补税罚款120万元!我们先……初学JavaWeb,这些你弄明白了吗?一。Tomcat服务器的安装第一步:准备服务器,在apache官网下载常用的服务器有:Tomcat、jetty、jboss,初学者一半用Tomcat服务器,初学者还……做芯片哪有什么弯道超车,从0到1突破要能板凳坐得十年冷芯片是大家关注的焦点,怎么才能有所突围呢?中国芯片产业弯道超车的机会在哪里?。中国的社会是一个很浮躁的社会,这种浮躁也传导到了科研领域。一遇到问题,很多人心就很急功近利,比如芯……潘多拉魔盒是否已被打开?第一支FDA授权销售的电子烟来了据悉,著名的电子烟生产企业Vuse公司的三种产品被正式授权销售,这是美国食品和药物管理局(FDA)在一场有争议的公共卫生战役中的第一个重大举措。上图:Vuse公司的Sol……苹果手机怎么弄便签在哪找苹果手机便签苹果手机是很多人都在使用的一款智能手机,在使用它的时候,有很多功能强大的软件可以安装使用,通过这些软件可以获取很多附加功能。便签软件是很多人工作生活中的好帮手,苹果手机怎么弄便……赔偿122亿,LG将承担通用汽车召回的全部责任电车汇消息:昨日,通用汽车官网发布消息称,已经与电池供应商LG化学就雪佛兰Bolt的召回成本问题达成了协议,LG同意最高将会向通用汽车赔偿19亿美元(约合人民币122。5亿元)……如何搞定只问不买的客户无论是线上还是线下销售,这一套话术技巧一定要收藏,不然聊一个嗝屁一个。一、顾客问:怎么卖错误回答:直接报价(谁先报价谁先死)千万不要着急去报价。要先让顾客充分……
2021年快过完了,还有使用华为Mate9的人吗?还够用不?我就在用啊,但不是当主力机再用你想想看,几年前的手机现在用,对年轻人来说肯定没那么好使啦,现在我只把他当个备用机。收发一下验证码儿,玩玩微信,头条之类的,还是没问题!虽然不会卡……买二手相机镜头,淘宝和闲鱼哪个更靠谱?还是摄影论坛交流好?作为一名摄影爱好者,由于自身经济条件的限制,对摄影器材的选择是非常谨慎的,除了第一部相机是买的全新的外,其他的镜头之类的基本都是在咸鱼网上买的。咸鱼和淘宝有啥不同?我把我这几年……监管高压下,比特币现状如何?牛市还有希望吗?比特币面临高压,行情表现低迷最近,加密货币处境艰难,内外均面临压力:一方面,比特币因能源消耗问题,成为强监管的切入点,以禁止比特币挖矿、交易,通过税收等措施,来加强……再不了解真晚了!农业这个分支在闷头赚大钱,2018年融资超百说到农业互联网,大家想到的都是智慧农业、生鲜农产品电商、以及针对农民的农资电商等等,其实这些农业B2C更多的是赚吆喝,盈利的不多,倒是打通农产品第一公里的农业B2B,则在闷头发……云市场发展迅速,企业如何用好公有云?现在的云主要是还是基础设施云(如ECS,CDN,等等),中间件(如mq,cache等)的云。这些都是要在上面开发或是移植现有业务上去才能使用的。这就限制为大企业或是部分特……恒大欠债出事和华为被国外打压,为什么网友的态度大不相同?谢谢邀请。虽然都是创造社会价值,恒大创造价值的目的是攫取更多社会利益,华为在攫取利益同时,客观上更多是推动社会进步,尤其是中国科技进步,提高中国国力。两者不可同日而……猿辅导否认转型卖羽绒服重点业务是智能教育市场针对猿辅导转型卖羽绒服的媒体报道,20日午后,猿辅导相关人士称,此前媒体的报道有误,猿辅导没有转型卖羽绒服,只是投资了一个服装公司。猿辅导方面表示,公司重点业务是进军To……山里孩子的为什么,用一本书来回答一本书对乡村孩子意味着什么?生活在草原的孩子,从这里领略了大山的巍峨,生活在山间的孩子,从这里得知了大海的辽阔。一本书能回答他们为什么天是蓝的?……大跳水!iPhone12直降2000!各大平台售价跌至冰点作者番番来源极果编辑部按照正常时间,再过10天iPhone13系列就要发布了,相信大伙儿跟极果君一样,都蛮期待这个一年一度的数码圈春晚,这不,微博随便一搜索iPho……发布全球领先技术让充电像加油一样快广汽埃安未来将择机上市8月30日,广汽埃安发布了能够实现充电5分钟,续航200公里的超倍速电池技术和全球充电功率最高的A480超充桩。该技术实现让充电像加油一样快,从而打消用户里程焦虑,未来新能源汽……Python机器学习(五十四)SciPyk均值聚类聚类(Kmeansclustering)是在一组未标记的数据中,将相似的数据(点)归到同一个类别中的方法。聚类与分类的最大不同在于分类的目标事先已知,而聚类则不知道。Km……如何挖掘科技支撑双碳潜力来源:人民网人民日报近日,科技界传来好消息:我国科学家提出的全新接触电致催化机制,既可以用于对环境友好的材料进行催化,又能避免对环境二次污染,为化学、能源等工业的低碳发展……
友情链接:易事利快生活快传网聚热点七猫云快好知快百科中准网快好找文好找中准网快软网