您的位置:首页 > 互联网

新图像合成模型LCM SD生成图片推导步骤减少至4步!

发布时间:2023-10-25 00:28:15  来源:互联网     背景:

要点:

  • 研究人员提出了一种新的图像合成模型,称为潜在一致性模型(LCM),可以在少步推理的情况下生成高分辨率的图像。

  • LCM是从预训练的潜在扩散模型(LDM)中有效地提取出来的,可以直接预测潜在空间中的概率流ODE的解,避免了多次迭代的需要。

  • LCM还引入了一种新的微调方法,称为潜在一致性微调(LCF),可以在定制的图像数据集上进行快速的少步推理,实现了文本到图像的生成。

小米13价格

10月24日 消息:图像合成是计算机视觉领域的一个重要研究方向,目标是根据给定的条件生成逼真的图像。近年来,潜在扩散模型(LDM)在这方面取得了显著的成果,能够生成高分辨率和高质量的图像。然而,LDM的一个主要缺点是它们需要进行多次迭代的采样过程,导致生成速度缓慢。

为了解决这个问题,本文受一致性模型的启发,提出了一种新的图像合成模型,称为潜在一致性模型(LCM)。LCM可以利用任何预训练的LDM,包括稳定扩散模型(SD),并通过少步推理生成高分辨率的图像。LCM的核心思想是将引导反向扩散过程视为求解一个增广概率流ODE(PF-ODE),并设计一个网络来直接预测该ODE在潜在空间中的解,从而减少迭代次数和计算量。

向往的生活第五季冰箱

LCM可以从预训练的无分类器引导扩散模型中有效地提取出来,在只需要32个A100GPU小时的训练时间内,就可以生成768×768分辨率的高质量图像。以往我们用 SD 生成图片起码需要20步的推导步骤,但是使用 LCM 只需要4步就行,从一些测试结果看6-8步可能是一个理想的步骤。

项目地址:https://latent-consistency-models.github.io/

这个技术可以让4090在1秒钟生成10张512X512大小的图片.如果可以用在 Animetadiff 中的话可以大幅提高视频生成效率。

苹果产量预估

此外,论文还介绍了一种新的微调方法,称为潜在一致性微调(LCF),它专门用于在定制的图像数据集上微调预训练的LCM。LCF不需要教师扩散模型,只需要少量数据和训练步骤,就可以使LCM产生具有定制风格的图像。

论文在LAION-5B-Aesthetics数据集上对LCM进行了评估,结果表明LCM在文本到图像生成任务上达到了最先进的性能,并且具有快速、高保真、低失真和低噪声等优点。

论文还展示了LCM使用LCF在Pokemon和Simpsons两个定制数据集上生成图像的效果,证明了LCM具有良好的泛化能力和适应能力。

本文为图像合成领域提供了一种新颖且有效的方法,不仅提高了生成速度和质量,还降低了训练成本和数据需求。本文也为进一步探索潜在空间中的一致性和结构提供了一个有益的尝试。


返回网站首页

本文评论
实惠笔记本「实惠的笔记本品牌」
近年来,随着科技的不断发展,笔记本电脑已经成为了人们日常生活中必不可少的工具之一。而对于大多数人来说,价格是购买笔记本电脑时最为关注的一个因素。因此,现在出现了很多实惠...
日期:06-03
微软中国员工谈裁员传闻:邮件只发给了高层_微软裁员不到1000人
(广隶)北京时间6月22日消息,据国外网络媒体报道,微软公司在内部电子邮件中提醒员工,下个月将进行重组,并裁掉部分冗员。腾讯科技从微软中国内部员工处了解到,确实听说了该消息,但非...
日期:07-30
万门教育:为教育搭建“高铁”,将优质在线课程传递给更多的孩子
  互联网近年来发展迅速,从O2O到移动支付,从出行到饮食,互联网以前所未有的深度塑造着每一个席卷的行业。然而令人遗憾的是,互联网对于教育事业的塑造远不及其他。   十八...
日期:05-11
小米“掐架”华为!发起专利无效请求:到底发生了什么?「华为专利为什么不收专利费」
小米和华为“掐架”了!根据国家知识产权局最新发布的口审公告显示,小米近期对华为专利“ZL201810188201.7”发起了无效宣告请求,将于7月21日口审。中国的手机芯片厂除了该专利...
日期:07-05
苹果成本增千元!iPhone14 Plus上市破发 黄牛不敢囤:网友直言最不保值机型
没有让人意外,iPhone 14 Plus上市后就破发,这可能也是网友送它年度最不保值手机的称号吧。从第三方商家最新报价看,iPhone 14 Plus国行价格已经比官方便宜几百元,而更贵的版本最...
日期:10-08
关乎您的生活!5月31与海尔智家共赴露营音乐会「海尔智家生活体验馆」
不知大家发现没有,近两年的 618 跟往年相比变化很大。熬夜付尾款、抢单拼手速的现象越来越少,相比满减,大家愈发关心产品自身的使用和体验,注重高品质生活的打造。对于高品质的...
日期:05-31
便宜买显卡 休想!NV又要对显卡涨价了:自家库存马上短缺 AI GPU需求大增
快科技5月23日消息,很显然人工智能提高了显卡的需求,而NV也是因此大赚特赚,当然这也带动了显卡的消耗。推特被收购了吗b站直播的条件是什么尽管NVIDIA尽了最大努力,但可能无法跟...
日期:05-23
OpenAI CEO:初创公司完全远程工作是“科技行业最严重的错误之一”「flex jobs公司创始人发现远程办公需求增加的原因有」
5月8日 消息:OpenAI 首席执行官山姆·阿尔特曼(Sam Altman)表示,初创公司需要面对面的工作才能有效。他表示,远程工作是科技行业最大的错误之一,实验已经结束。许多公司CEO首席执...
日期:05-08
iPhone 15终极曝光:价格、规格一网打尽,全面泄密_苹果15会是什么样的
哈喽,您好!我是原呵呵,点点关注吧,更多精彩内容等着您iPhone 15的发布日越来越近了,仅有数月,我们就将迎来最新一代的苹果手机。据传言,如果iPhone 15的传闻属实,今年的更新将带来设...
日期:07-04
三网融合上半年有望获突破:内容争夺战打响
  在三网融合产业链中,内容扮演着重要角色,如何打造一个可管理、可控的内容集成和分发平台是当前电信及广电业都需解决的关键问题。   优秀内容争夺战打响   “广电行...
日期:07-25
判了!醉驾撞人拖行的宝马女司机获刑超6年:拖行被撞者近一公里
娄底市娄星区人民法院官网消息,7月7日,娄底市娄星区人民法院依法对被告人肖某某交通肇事案一审公开宣判,判处被告人肖某某有期徒刑六年三个月。经审理查明,2022年9月2日,被告人肖...
日期:07-08
dell商用笔记本「戴尔商务笔记本电脑性价比排名」
随着商业环境的不断发展和变化,越来越多的企业开始重视IT设备的选购和配置。其中,商用笔记本作为企业员工办公的工具之一,也受到了高度关注。而Dell作为知名的IT设备制造商,其商...
日期:05-31
《英雄联盟》LPL夏季赛WBG 2:0完胜EDG:Uzi不交闪现引热议「lpl夏季赛:ig负omg苦吞连败 edg完美运营轻取ra」
7月17日消息,在《英雄联盟》2023 LPL夏季赛第八周第一日的第二场比赛中,由WBG战队对阵EDG战队,经过两轮大战,WBG以2:0的比分轻松拿下EDG,获得第10胜。比赛结束后,Uzi不交闪现”的...
日期:07-18
性能最强悍的安卓手机!红魔8S Pro系列发布:3999元起_红魔是安卓手机吗
快科技7月5日消息,红魔8S Pro系列正式亮相。苹果12与苹果13跑分售价方面,红魔8S Pro暗夜骑士款8GB 128GB 3999元,8GB 256GB售价4399元;暗夜骑士/冰封银翼款12GB 256GB售价4799元...
日期:07-05
红米k30至尊版天玑1000+值得买吗「Redmi K60至尊版本月发布 搭载天玑9200 、独显芯片」
8月3日 消息:红米官方宣布,Redmi K60至尊版将于本月发布,成为红米首款双芯旗舰。该机将搭载天玑9200处理器,并配备独显芯片X7,配合狂暴引擎2.0调校,释放出强大的性能表现。锐龙46...
日期:08-03
鲸算科技直播助农,单场销售1200箱黄果柑
  2020年3月7日-9日,鲸算科技联合中国扶贫基金会线上直播销售黄果柑,助力灾后重建地区之雅安石棉县农户致富。   黄果柑,也被称为“阳光金果”,在石棉县,这里的年日照时长...
日期:02-12
超星未来与恒达智控达成战略合作,携手拓展AI芯片行业市场「超星未来科技怎么样」
8 月 4 日,「超星未来」宣布与郑煤机旗下子公司煤炭智能化开采控制系统提供商「恒达智控」达成战略合作,双方将在矿山领域围绕井下集控中心AI分析设备、井上AI分析服务器、边...
日期:08-12
黑鱼适合放生到哪里「黑鱼被遗忘洗手间存活11个月掉色 超强生命力引围观:准备放生」
近日,湖北武汉王女士在主卧卫生间发现过年时养的鱼还活着,这也是吸引了众多网友的围观。王女士介绍,这条鱼一直在桶里,倒出来发现竟然还活着,便转移到了洗脸盆里。王女士称鱼是丈...
日期:11-03
啥是“佩奇”?讯飞输入法iPhone版配齐语音便签和随心说_iphone用讯飞输入法
  最近《啥是佩奇》的纪录片意外火遍朋友圈、微博、空间……那么,啥是佩奇?回家过年,一家人齐齐整整就是“配齐”;语音输入法,标配1分钟400字、98%的通用语音识别率、多语种...
日期:08-18
荣耀Earbuds 2 SE TWS耳机惊艳上市,赵明称未来每月都有全场景新品推出_荣耀Earbuds 2 SE耳机
  6月16日,荣耀举行新品发布会,在带来荣耀50系列手机的同时,还推出了全新TWS主动降噪耳机荣耀Earbuds 2 SE——这也预示荣耀“1+8+N”智慧全场景战略正在加速发力。发布会后...
日期:01-21