您的位置:首页 > 互联网

Stability.ai开源全新文生图模型,性能比Stable Diffusion更强!

发布时间:2024-02-15 17:10:24  来源:互联网     背景:

声明:本文来自于微信公众号 AIGC开放社区(ID:AIGCOPEN),作者:AIGC开放社区,授权转载发布。

2月13日,著名大模型开源平台Stability AI在官网,开源了全新文本生成图像模型——Stable Cascade(以下简称“SC”)。

据悉,SC是根据最新Würstchen基础模型开发而成,大幅度降低了对推理、训练的算力需求,例如,训练Würstchen模型使用了约25,000小时性能却更强劲,而Stable Diffusion2.1大约使用了200,000小时。

所以,SC的部署非常便捷适合中小企业和个人开发者,可以在4090、4080、3090等消费级GPU上进行微调。目前,SC只能用于学术研究无法商业化,未来会逐步开放。

开源地址:https://github.com/Stability-AI/StableCascade

Würstchen论文地址:https://openreview.net/pdf?id=gU58d5QeGv

自Stability AI发布Stable Diffusion系列文生图模型以来,全球已有几十万开发者使用其产品,Github超过60,000颗星,成为开源扩散模型领域的领导者。

但Stable Diffusion有一个弊端,就是对AI算力资源要求很高,不太适合普通开发者进行模型微调。所以,在提升性能的前提下又发布了新一代文生图模型SC。

vivo z3i多少钱

Stable Cascade模型介绍

SC是基于Würstchen模型开发而成,AIGC开放社区将根据其论文为大家解读技术原理和功能特性。

与之前的Stable Diffusion系列相比,SC的核心技术思路是将文生图过程拆解成A、B、C三个阶段来完成。

这样做的好处是,在保证质量的前提下可以对图像进行极限分层压缩,然后利用高度压缩的潜在空间实现更优的图像输出,以减少了对传输、算力、存储的需求。

A阶段:潜在图像解码器,通过使用VQGAN模型来解码潜在图像,并生成完整分辨率的输出图像。

VQGAN里面有一个编码器和一个解码器,编码器会把原始图像编码成较低分辨率但信息丰富的离散向量;

解码器则可以从这些向量重构出与原始图像极为相似的图像。整体实现了16倍的数据压缩。

B阶段:以第A阶段的潜在表示为条件,并结合语义压缩器的输出和文本嵌入来进行条件生成。

在扩散过程,重构了第A阶段训练得到的潜在空间,并受到语义压缩器提供的详细语义信息的强烈引导。

这种条件引导,确保了生成的图像可精准还原文本提示,提升对文本的语义理解。

C阶段:以B阶段的生成的潜在图像和输入文本为条件,生成具有更低维度的潜在表示。

通过在低维空间中进行训练和推理,可以更高效地进行扩散模型的训练和生成,大大降低了计算资源的需求和时间成本。

所以,整个图像生成的过程这三大模块就像齿轮一样环环相扣,通过训练一个在低维潜在空间上的扩散模型,并结合高度压缩的潜在表示和文本条件,以及向量量化的生成对抗网络,实现了高效、低消耗的文本到图像合成。

Stable Cascade特色功能

除了文本生成图像之外,Stable Cascade 还可以生成图像变化和图像到图像的特色功能。

图像变化:基于原始图像,在不改变颜色、整体架构的情况下,衍生出更多形态的图像。

其技术原理是,使用 CLIP 从给定图像中提取图像嵌入,然后将其返回到模型中。

图像到图像生成:上传一张图像,然后生成相似形态,不同颜色、类型的图像。其技术原理是,向给定图像添加噪声,然后将其用作生成的起点。

Stable Cascade实验数据

为了测试SC的性能,研究人员将其与SDXL、SDXL Turbo、Playground v2和Würstchen v2主流扩散模型进行了深度比较。

结果显示,Stable Cascade在即时对齐和图像质量方面都表现最佳,推理步骤却比SDXL、Playground v2更少。

此外,在训练Würstchen基础模型时,参数总量比SDXL多14亿,但训练成本仅是其8分之一。


返回网站首页

本文评论
被试用期“坑惨”的应届生「应届生找工作都有试用期吗」
声明:本文来自于微信公众号 开菠萝财经(ID:kaiboluocaijing),作者 | 苏琦 编辑 | 金玙璠,授权转载发布。“应届生试用期被辞退,哥哥姐姐们我该怎么办啊?”“大冤种就是我,马上要转...
日期:11-07
极光:2020年中国拍照手机发展趋势分析(2020年拍照手机排行榜)
  进入2020年,伴随智能手机行业存量竞争加剧,以及5G行业即将全面爆发的关键一年,不同手机品牌围绕摄像头子系统的竞争,变得前所未有的激烈。在这场军备竞赛中,不同品牌对手机...
日期:07-14
「苹果吃相难看-苹果电池保外涨价,网友,我哭死」「iphone保外电池」
来源:中关村在线苹果在iPhone 15系列发布后,再次调整了老款iPhone电池更换保外价格。涉及的机型包括iPhone 7、iPhone 8、iPhone SE系列,由528元上涨至559元;iPhone X、iPhone X...
日期:09-14
安卓 恶意软件_Android Market出现新型恶意软件
【赛迪网讯】5月15日消息,据国外媒体报道,日前一种新型的恶意软件出现在谷歌的Android Marketplace上,并且隐藏在合法的应用程序背后。用户会被欺骗,从而下载恶意代码,目前已知...
日期:07-27
买羊骗局揭秘「警惕!女子玩羊了个羊被骗9万元:弹窗广告有陷阱」
近期微信小游戏羊了个羊”爆火,不少人纷纷加入,并为之着迷,但需要提醒大家的是,玩游戏时一定要提高警惕,谨防被骗。据江苏新闻报道,近日常州严女士在玩羊了个羊游戏时,为了获取道具...
日期:10-06
报告称近4成职位工资超10000元 新型灵活就业学历要求不高_灵活就业工资多少
越来越多人选择灵活就业,尤其是年轻人。统计数据显示,中国灵活就业人数已达2亿人,这一趋势在新型经济业态下愈加明显。根据《2023中国新型灵活就业报告》,新型灵活就业职位提供...
日期:09-29
小小年纪“染上”网络欺凌怎么办?「小学生网络欺凌」
  来源:法治日报  □ 本报记者  韩丹东  □ 本报实习生 关楚瑜  近日,一名来自广东的高一学生林芝(化名)向《法治日报》记者打来电话求助,称自己只是在网上发了一张“...
日期:09-08
瑞幸联名猫和老鼠上热搜  网友:为贴纸买了好几杯咖啡_瑞幸咖啡系列
瑞幸咖啡宣布与经典动画IP《猫和老鼠》联名合作,推出了新品马斯卡彭生酪拿铁,售价为29元。这一消息迅速成为微博热搜的话题,引起了许多网友的热议和关注。购买联名款的顾客纷纷...
日期:10-09
惠普携手兆维:以高品质产品助力自助服务设备行业发展_惠普 兆芯
(原标题:惠普携手兆维:以高品质产品助力自助服务设备行业发展) 我们进入了一个物联网飞速发展的时代。随着智能化、便捷化的自...
日期:10-28
联想大数据「联想大数据测试面试」
是联想集团推出的一项重要业务,致力于为企业提供全方位的大数据解决方案。作为全球领先的信息技术公司之一,联想在数据采集、数据处理、数据分析、数据挖掘等方面拥有丰富的经...
日期:05-29
苹果CEO库克身价达20亿美元_苹果ceo库克身价达20亿美元
根据《福布斯》公布的数据,苹果公司CEO蒂姆・库克的身价为20亿美元(当前约合142.8亿元人民币),如果按照净资产计算全球最富有的人,库克排名第1647位。(钛媒体)moto360价格...
日期:12-24
谷歌的目标是 2023 年智能手机销量比今年翻一番_2020年世界智能手机销量前三
10月8日消息:谷歌CEO Sundar Pichai周五接受日经新闻采访时表示,到2024年的4年内,谷歌计划在日本共投资1000亿日元,其中部分资金将用于开设谷歌在日本的首个数据中心。现代ix35...
日期:10-09
联发科官宣天玑9200 将于5月10日发布 安兔兔跑分超136万 稳占安卓性能第一
联发科新一代旗舰级5G芯片正式官宣了,命名确定为天玑9200 ,将在5月10日发布。对于天玑9200 这枚芯片,联发科的海报中没有透露太多信息,不过强调强悍”和旗舰 ”,这显然是在暗示它...
日期:04-28
别让技术停留在六年前 一文读懂UFS 3.0的重要性_ufs3.0有什么用
  近日某品牌旗舰手机发布,本想引来一场热议,没想到却掀起一场风波。风波的缘起,是被细心的网友发现了该品牌所发布的“旗舰手机”在配置上不应该出现的短板——在手机内存...
日期:09-09
iPhone 15系列带额外功能:可以为另一台iPhone充电
苹果公司最新推出的iPhone 15系列手机,最大变化是采用了USB-C接口,取代了以往使用的Lightning接口。这一变化使得iPhone 15在连接性方面更加方便。此外,iPhone 15还增加了一个...
日期:09-21
国产单机《完蛋!我被美女包围了!》爆火出圈!Steam口碑上涨好评如潮
11月1日消息,最近,国产真人模拟恋爱互动游戏《完蛋!我被美女包围了!》爆火出圈,游戏直播、游戏片段在短视频平台受到网友关注。自10月18日上线Steam平台以来,《完蛋!我被美女包围了...
日期:11-02
主动避免碰撞!Luminar公司推出自动紧急转向技术_自动紧急制动系统 怎么用
快科技1月10日消息,据媒体报道,激光雷达公司Luminar在CES 2024首次公开了最新的AES自动紧急转向功能。据悉,AES自动紧急转向功能可于激光雷达和车辆其他安全系统协作,可以在不依...
日期:01-11
哪吒汽车宣布部分车型涨价 涨幅 3000 - 6000 元_哪吒汽车优惠
1 月 4 日讯:哪吒汽车宣布对部分车型进行的价格调整,涨幅 3000 元- 6000 元。哪吒S调整后售价区间为20.28-34. 18 万元,哪吒U-II调整后售价区间为13.58-16. 58 万元,哪吒V调整...
日期:01-04
苏宁易购双十一优惠券_苏宁双十一超级拼购日,用券更划算
  十月已经进入尾声,十一月的钟声即将敲响,万众期待的双十一狂欢购物节越来越近,各种大促活动优惠来袭。   在如此多的优惠活动里,最让人动心的莫过于苏宁超级拼购日活动了...
日期:06-15
配6.1英寸刘海屏!iPhone SE 4曝光_刘海屏的iPhone
据Macrumors报道,根据显示器供应链顾问(DSCC)分析师Ross Young的说法,第四代iPhone SE将配备6.1英寸LCD显示屏,并在显示屏顶部有一个“刘海”。Ross Young表示,他已经修改了对第四...
日期:10-15