您的位置:首页 > 互联网

谷歌生成器「谷歌推新型生成式AI模型IGN 单步即可生成逼真图像」

发布时间:2023-11-14 10:29:11  来源:互联网     背景:

要点:

1. UC伯克利和谷歌提出的幂等生成网络(IGN)是一种新型生成式AI模型,能够通过单步生成逼真图像,不需要多步迭代。

2. IGN与传统的生成对抗网络(GAN)和扩散模型不同,它是一个自对抗模型,同时完成生成和判别,并尝试在单个步骤中将输入映射到目标数据分布。

3. 通过实验证明,虽然IGN目前生成结果无法与最先进的模型竞争,但在推理方面更加有效,可以输出一致性更高的结果,具有潜在的医学图像修复应用。

11月14日 消息:生成式AI模型的新范式要来了。UC伯克利谷歌提出幂等生成网络(IGN),只需单步即可生图。当前,生成式AI模型,比如GAN、扩散模型或一致性模型,通过将输入映射到对应目标数据分布的输出,来生成图像。通常情况下,这种模型需要学习很多真实的图片,然后才能尽量保证生成图片的真实特征。

成都国美地址

最近,来自UC伯克利和谷歌的研究人员提出了一种全新生成模型——幂等生成网络(IGN)。IGNs可以从各种各样的输入,比如随机噪声、简单的图形等,通过单步生成逼真的图像,并且不需要多步迭代。这一模型旨在成为一个全局映射器(global projector),可以把任何输入数据映射到目标数据分布。

论文地址:https://arxiv.org/abs/2311.01462

有趣的是,《宋飞正传》中一个高效的场景竟成为研究人员的灵感来源。这个场景很好地总结了幂等运算符(idempotent operator)这一概念,是指在运算过程中,对同一个输入重复进行运算,得到的结果总是一样的。

IGN与GAN、扩散模型有两点重要的不同之处:与GAN不同的是,IGN无需单独的生成器和判别器,它是一个自对抗的模型,同时完成生成和判别。与执行增量步骤的扩散模型不同,IGN尝试在单个步中将输入映射到数据分布。位于同一空间,即它们的实例具有相同的维度。

研究人员承认,现阶段,IGN的生成结果无法与最先进的模型相竞争。在实验中,使用的较小的模型和较低分辨率的数据集,并在探索中主要关注简化方法。当然了,基础生成建模技术,如GAN、扩散模型,也是花了相当长的时间才达到成熟、规模化的性能。研究人员在MNIST(灰度手写数字数据集)和 CelebA(人脸图像数据集)上评估IGN,分别使用28×28和64×64的图像分辨率。

研究人员采用了简单的自动编码器架构,其中编码器是来自DCGAN的简单五层鉴别器主干,解码器是生成器。训练和网络超参数如表1所示。图4显示了应用模型一次和连续两次后两个数据集的定性结果。如图所示,应用IGN 一次 (f (z)) 会产生相干生成结果。然而,可能会出现伪影,例如MNIST数字中的孔洞,或者面部图像中头顶和头发的扭曲像素。

pixel 3 XL

再次应用 f (f (f (z))) 可以纠正这些问题,填充孔洞,或减少面部噪声斑块周围的总变化。表明,当图像接近学习流形时,再次应用f会导致最小的变化,因为图像被认为是分布的。作者通过执行操作证明IGN具有一致的潜在空间,与GAN所示的类似,图6显示了潜在空间算法。

研究人员还验证通过将来自各种分布的图像输入到模型中以生成其等效的自然图像,来验证IGN全局映射的潜力。研究人员通过对噪声图像x+n 进行去噪、对灰度图像原始图像x,这些逆任务是不适定的。IGN能够创建符合原始图像结构的自然映射。如图所示,连续应用f可以提高图像质量(例如,它消除了投影草图中的黑暗和烟雾伪影)。通过以上结果可以看出,IGN在推理方面更加有效,在训练后只需单步即可生成结果。它们还可以输出更一致的结果,这可能推广到更多的应用中,比如医学图像修复。

蓝牙耳机哪个牌子好平价品牌排行榜

谷歌用ai设计ai芯片


返回网站首页

本文评论
特斯拉高速别车后续来了!司机已被控制:情节严重将面临刑责_特斯拉被赶下高速
日前,一辆特斯拉高速多次别车逼停后方车辆的视频引发了社会各界的广泛关注。据媒体报道,目前,当地交管部门已经对该车主进行了控制,目前正在调查处理中。为什么华为matebook从此...
日期:10-17
收入只够交保险 ChatGPT估值已上2000亿-创始人对钱没兴趣
5月17日消息,作为当前最火的AI应用,ChatGPT受到各大投资机构的追捧,不仅微软投资了130亿美元,前不久就还接受了多家基金的入股,母公司OpenAI估值达到了290亿美元,差不多2000亿元了...
日期:09-28
京东快递全新保价服务“全额保”上线:快件全损全额赔_京东快递 价保
9月29日消息,从京东快递方面获悉,今日,京东快递面向个人寄递场景推出全新保价服务全额保。官方表示,消费者在寄递物品时购买该服务,可在保价范围内享受足额赔偿,同时将有专人专线...
日期:10-02
联通物联网公司与亚信科技签署战略合作协议(亚信科技和中国联通)
  3月14日,联通物联网有限责任公司与亚信科技在南京举行智慧健康战略合作及创新中心入驻签约仪式。   此次合作协议的签署,明确了双方将在智慧健康领域展开深度合作。通...
日期:06-05
比亚迪海洋网年终成绩单出炉:狂卖70万台、宋PLUS占一半还多_比亚迪销量最新
目前比亚迪品牌旗下有王朝和海洋网两大车系,其中海洋网车系比较新,旗下包括海洋网生物(纯电)和海洋军舰(DM-i)两大分类,可能你不知道的是,目前比亚迪大热门车型宋PLUS也放在了海洋网...
日期:01-03
骁龙8 Gen2新旗舰 三星S23+高清渲染图抢先看:SIM卡槽不见了
iPhone 14系列发布后,安卓厂商们也即将开始新一波旗舰的换代,预计时间点会安排在11月的骁龙技术峰会也就是骁龙8 Gen2推出之后。本周,爆料大神 OnLeaks抢先分享了号称是三星Gal...
日期:09-28
微软雅虎搜索联盟已经达到了另一个里程碑了_微软雅虎搜索联盟已经达到了另一个里程碑
  1月17日消息,据国外媒体报道,微软雅虎搜索联盟在一年前获得了欧盟委员会的批准。在去年8月,这个搜索联盟宣布,在美国和加拿大的有机的搜索已经过渡到微软的必应搜索引擎。...
日期:07-25
澳大利亚新闻集团利用AI每周生成3000篇当地新闻报道「澳大利亚新闻有限公司」
8月2日 消息:澳大利亚新闻集团(News Corp Australia)执行主席迈克尔·米勒 (Michael Miller) 透露,该公司每周使用生成式人工智能制作3,000篇文章。米勒表示,一个由四名员工组成的...
日期:08-02
北大美女学霸用vlog记录留学日常,女博士的刻板印象在西瓜视频被颠覆
  “你是女博士啊!”这一句感叹,背后往往着隐藏复杂的潜台词。   长期以来,外界对女博士都有很强的偏见。甚至将女博士称为独立于男人、女人之外的“第三类人”。一提到...
日期:03-28
今天是世界表情符号日:研究显示我国表情包日发送量达6亿次「世界表情日是什么时候?是怎么决定的?」
7月17日是世界表情包日”。据央视财经报道,研究数据显示,在我国,每日表情包发送量为6亿次左右。表情包的真正盛行源于社交软件的广泛普及,用户不仅能使用软件自带的表情包,还可以...
日期:07-17
阿里通讯云平台「阿里云通义千问APP上线 支持创意文案等功能」
10月30日 消息:近日,阿里云旗下通义千问APP正式上线。它具备多种核心能力,包括创意文案、办公助理、学习助手和趣味生活等方面的功能。通义千问,是阿里云推出的一个超大规模的...
日期:10-30
移动应用安全_移动APP永远绕不过“安全”这个槛!
  手机刷起来   淘宝逛起来   快递收起来   外卖吃起来   ……   要说现代人出门需要拿什么?   十个人里就有十个人的回答是——手机   这话没毛病吧!  ...
日期:08-08
马斯克“坑煞”中国友商_马斯克的骗局
作者:普子胥出品 | 网易科技《态℃》栏目组“今年一季度或许是汽车行业、新能源汽车行业最困难、最有挑战的时期。”在2月6日的媒体沟通会上,蔚来联合创始人兼总裁秦力宏表示,...
日期:02-08
亚马逊云服务CEO表示,没有云服务就没有人工智能_亚马逊提供的云计算服务
本文概要:1. 亚马逊云服务(AWS)首席执行官亚当·塞利普斯基基表示,人工智能(AI)与云计算密不可分,没有云就没有 AI。神舟笔记本20702. 塞利普斯基认为,目前只有大约10% 的潜在客...
日期:08-09
什么是谷歌地图开创的功能「Google推出新功能以让地图变得更具沉浸感」
如果现在打开Google地图那么用户可能会用传统的2D地图来搜索自己想去的地方。但Google有一些想法可以帮助用户以更沉静感的方式发现用户周围的世界,它在周三的Search On活动...
日期:09-30
iPhone 用户反馈升级 iOS 17 后,无法使用苹果“隔空打印”功能_苹果找不到隔空打印
IT之家 10 月 24 日消息,部分 iPhone 用户反馈,升级到 iOS 17 之后,无法正常使用“隔空打印”(AirPrint)功能。2014年小米手机全球销量排名用户反馈升级之后,在“隔空打印”窗口中...
日期:10-24
节目效果拉满!马斯克在扎克伯格家门口测试自动驾驶 戏言上门决斗
快科技8月28日消息,日前,特斯拉CEO马斯克在其个人账号上直播测试了特斯拉最新版本的FSD自动驾驶系统,此次直播并未经过任何的剪辑处理,并为观众们带来了更加详细的讲解。比尔盖...
日期:08-28
福布斯 2023 年全球最佳创投人榜:沈南鹏第一_2021年福布斯全球最佳创投人榜
IT之家 5 月 6 日消息,福布斯发布 2023 年全球最佳创投人榜,位居榜首的最佳创投人是红杉中国创始及执行合伙人沈南鹏,这是他第 12 次上榜,第 4 次问鼎。沈南鹏曾连续三年(2018-20...
日期:05-07
短信直连小程序!四大经典场景 开启银行拉新促活的轻量化时代
  从2017年发展至今,微信小程序凭借着生态利好、使用便利、功能齐全等优势,已然成为了银行提供产品服务的重要渠道之一,承接了大部分的轻量化运营服务。但与此同时,小程序只...
日期:08-15
人类首次月球背面采样返回 嫦娥六号探测器预计2025前后发射_嫦娥几号拍下了人类探测器在月球背面拍摄的第一张照片
快科技4月10日消息,我国的嫦娥系列月球探测器已经完成了绕落回三步走的目标,未来还会有嫦娥六号、七号、八号任务升空,其中嫦娥六号预计在2025年前后实施。中国航天科技集团在...
日期:04-11