您的位置:首页 > 互联网

超大杯Stable Diffusion免费来袭!「最强文生图开放模型」,提示词也更简单

发布时间:2023-07-28 15:56:57  来源:互联网     背景:

声明:本文来自于微信公众号量子位(ID:QbitAI),作者:明敏 克雷西,权转载发布。

Stable Diffusion最强版本,来了!

刚刚,SDXL1.0正式发布,可免费在线试玩。

效果上,无论是以假乱真的写实大片:

图片

超现实的熊猫喝啤酒:

图片

还是赛博朋克漫画,都非常nice~

图片

Stability AI表示,SDXL1.0能生成更加鲜明准确的色彩,在对比度、光线和阴影方面做了增强,可生成100万像素的图像(1024×1024)。

而且还支持在网页上直接对生成图像进行后期编辑。

(有一股和Midjourney、Firefly打擂台的味儿了)

图片

网友们已经按捺不住上手试玩了~

和基础Stable Diffusion相比,SDXL1.0生成结果更加准确和逼真。

图片

而且官方表示,提示词也能比之前更简单了。

这是因为SDXL1.0的基础模型参数量达到了35亿,理解能力更强。

对比基础版Stable Diffusion,参数量只有10亿左右。

由此,SDXL1.0也成为当前最大规模的开放图像模型之一。官方甚至直接说这就是世界上最好的开放图像模型。

图片

话不多说,我们来上手体验了~

把马斯克印在青花瓷上

SDXL1.0在操作上很便捷,直接输入prompt即可,还能从下面勾选风格、尺寸参数等。

图片

图片

一次生成默认是出4张图,如果不满意还可以点下方“加号”让它继续画。

图片

官方介绍说,现在让SDXL1.0生成大作,无需再加入“杰作”这种提示词了。

让它生成一幅日漫风格的图像,画风非常贴合,而且在光影的处理上也更加自然了。

1990s anime low resolution screengrab couple walking away in street at night

图片

或者是一幅风景照?也能以假乱真了。

图片

甚至是让马斯克站在中式庭院里,抬头斜望着天空……

2020双十一性价比高的扫地机器人推荐

Elon Musk in an ancient Chinese palace

图片

或者是把苹果收购了?

在「WWDC」上,他举着全新款iPhone向人们展示,身边还围满了记者和粉丝(doge)。

苹果市场低迷

Elon Musk releasing new iPhone at WWDC

除了这些老马的洋葱新闻之外,绘画风格的作品效果也不错。

左边的是齐白石水墨风格,而右边是一幅漫画。

左:Elon Musk delivering a speech, ink painting, Qi Baishi style

右:Elon Musk comic

除了绘画,也可以把老马放进我们的元青花。

Elon musk in the shape of Yuan Dynasty Blue and White Porcelain

上面展示的这些「老马的故事」,用的prompt都比较简单。

但从效果并没有因为提示词简单而拉胯,这也与官方的说法相印证。

图片

不过我们还是想看看,如果用更加复杂精致的prompt,会是什么样子?

我们找到了Midjourney创作的一张老马在苏联担任汽修工人的珍贵照片,重新喂给MJ,让它生成个prompt。

MJ生成了下面这样的prompt,我们就用它来测试SDXL:

Elon Musk(这里MJ生成的是a man) standing in a workroom, in the style of industrial machinery aesthetics, deutscher werkbund, uniformly staged images, soviet, light indigo and dark bronze, new american color photography, detailed facial features

风格完全符合我们的预期,细节也还不错。

再来一个复杂prompt的图作为收尾,同样是MJ根据此前的作品生成后喂给SDXL。

elon musk eating food with chopsticks, in the style of peter coulson, cross-processing/processed, pinhole photography, herb trimpe, james tissot, transavanguardia, spot metering

左边是SDXL的作品,右边是MJ的原版,大家可以对比一下。

提示词同样支持中文,不过似乎会在给出结果中倾向于国风,准确性可能也会受到影响。

真我gt2 pro是直屏吗

比如输入“一只老虎在海边”后,意外给出了一个国风妹子。

图片

效果大家都已经看到了,那么SDXL生成图片的速度如何呢?

对于免费用户来说,时间主要花费在排队上了,不过也不会等待太久。

在5.5秒的时间内,排队人数从160减少到了99。

图片

除了生成图像外,SDXL还提供了很多后期编辑功能。

具体来说,包括去除背景、细节处理、画幅扩增等等。

图片

这些功能是SDXL所在的Clipdrop平台上已有的,而SDXL可以一键将生成的图片传入对应模块。

这里我们选择背景消除功能展示一下,可以看出边缘的细节几乎没有什么破绽。

图片

目前,SDXL的免费使用额度还是比较高的,登录后每个账户每天可生成400张(需要排队)。

月付的价格是9美元每月,年付则相当于7美元(约50元人民币)每月,包含了1500张每天的SDXL额度,且无需排队。

图片

不过不同区域的价格似乎也有所区别,比如阿根廷的年付价格平摊到每月是742比索(约合19.4元人民币或2.7美元)。

图片

此外,由于付费版本实际上是Clipdrop平台的Pro订阅,所以也包含了该平台的其他功能。

除了Pro账户,还有API版本可供开发者使用(可以访问Stability AI、Amazon等平台)。

开放图像模型中的“最大杯”

在最新博客中,Stability AI介绍了SDXL1.0的更多技术细节。

首先,模型在规模和架构上都有了新突破。

它创新性地使用了一个基础模型(base model)+一个细化模型(refiner model)。

二者的参数规模分别为35亿66亿

图片

这也使得SDXL1.0成为目前规模最大的开放图像模型之一

Stability AI创始人莫斯塔克(Emad Mostaque)表示,更大规模的参数量能让模型理解更多概念,教会它更深层次的东西。

同时在SDXL0.9版本还进行了RLHF强化。

这也是为什么现在SDXL1.0支持短提示词,而且能分清红场(the Red Square)和一个红色的广场(a Red Square)。

图片

在具体合成过程中,第一步,基础模型产生有噪声的latent,然后由细化模型进行去噪。

其中基础模型也可以作为独立模块使用。

这两种模型结合能生成质量更好的图像,且不需要消耗更多计算资源。

官方介绍SDXL1.0可以运行在8GB VRAM的消费级GPU上,或者是云端。

除此之外,SDXL1.0在微调也有了提升,可以生成自定义LoRAs或者checkpoints。

Stability AI团队现在也正在构建新一代可用于特定任务的结构、风格和组合控件,其中T2I/ControlNet专门用于SDXL。

不过目前这些功能还处于beta测试阶段,后续可以关注官方更新。

图片

总结来说,文生图都是一个逐渐迭代的过程,SDXL1.0的目标就是让这个过程更加简单。

莫斯塔克表示,现在只需要5-10张图片,就能快速微调模型。

从用户反馈中也能看到,相较于Stable Diffusion,SDXL1.0更能让大家满意。

图片

实际上,从今年4月以来,Stability AI就发布了SDXL最早的测试版。

索尼游戏电视选择9000还是9500

6月份开始进行内测,前段时间发布了0.9版本,当时就预告了会在7月发布一个开放版本,即最新的1.0版本。目前相关代码权重已经发布在GitHub上。

而且Stability AI机器学习负责人表示,相较于SDXL0.9,1.0版本降低了对算力的需求。

感兴趣的童鞋快去试玩吧~

试玩入口:

https://clipdrop.co/stable-diffusion

GitHub:

https://github.com/Stability-AI/generative-models

参考链接:

[1]https://stability.ai/blog/stable-diffusion-sdxl-1-announcement

[2]https://venturebeat.com/ai/stability-ai-levels-up-image-generation-launch-new-stable-diffusion-base-model/

[3]https://techcrunch.com/2023/07/26/stability-ai-releases-its-latest-image-generating-model-stable-diffusion-xl-1-0/


返回网站首页

本文评论
淘宝商城包裹量翻了4倍 收货速度快了很多_淘宝运货速度
      “疯抢第一单到货啦!是茵曼的裤子!要知道我们是在遥远的广西的一个大山里的小县城啊!平时淘宝到货最快也要四天啊!我们太激动了!期待其他东西陆续到货!嘿嘿!商城给力!商...
日期:07-24
茶频道品茗论道「围炉煮茶点燃茶饮赛道“虚火”?」
声明:本文来自于微信公众号 营销看克(ID:yingxiaokanke),作者:大可,授权转载发布。为什么说短视频是精神鸦片冬日气温渐低,在阳光充沛的午后,三五好友围着茶炉,喝茶说笑,拍照打卡,暖意甚...
日期:02-05
荣耀CEO赵明:Magic V2的真正对手是iPhone 14 和 iPhone 15「荣耀总裁赵明:2019年将开设自营门店,推5g手机」
7月13日 消息:今天,荣耀发布了一款新款折叠屏手机Magic V2,它比一般的直板手机更轻薄,重量和厚度都更低。这款手机被赋予了旗舰级的折叠屏,成为一款轻盈薄型的折叠屏手机。太突...
日期:07-13
浏览器市场开打应用大战(浏览器应用程序)
  日前,中国本土最大浏览器厂商360旗下安全浏览器推出应用开放平台,并纳入其最新宣布的“360°开放计划”。至此,360旗下所有浏览器产品应用平台已全面开放,将浏览器市场竞争...
日期:07-30
曹德旺呼吁企业家不要做阿Q:2023年才是真正考验我们的时刻
1月9日 消息:2023年初,央视财经频道的《对话》栏目推出了重磅节目《对话·开年说|启动,2023!》,娃哈哈集团董事长宗庆后、阿里巴巴董事会主席兼首席执行官张勇、携程董事局主席...
日期:01-09
数据显示特斯拉Cybertruck电动皮卡已预订超过160万辆
11月28日消息,据国外媒体报道,特斯拉2019年11月22日推出的电动皮卡Cybertruck,虽然未能如期在最初宣称的2021年年底开始量产,但这款造型独具特色、性能强悍的电动皮卡,仍获得了不...
日期:11-30
软银“大瘦身”:愿景基金裁员幅度或达30%,高于外界普遍预期_软银愿景资本
  记者/李京亚  在软银单季经历毁灭性亏损之后,负责投资的愿景基金部门裁员幅度可能高于外界想象。  北京时间9月29日晚间,彭博社援引知情人士消息报道,软银集团预计将对...
日期:10-04
中国移动数智人打破数实壁垒,连接“人-物-场”「中国移动数字科技」
通信世界网消息(CWW)作为数字世界链接的枢纽,数智人在元宇宙这一生态圈层中担任着信息制造、信息传递的重要角色,是元宇宙“人-物-场”链接的核心数字资产与要素。近年来,在人工...
日期:07-25
华为Mate 50系列蓄势待发:至少三款旗舰 全系标配高通骁龙U「华为手机新款mate50」
今天,爆料人RODENT950绘制了Mate 50系列新品发布会海报,海报显示,华为Mate 50系列可能会在9月7日发布。目前Mate 50系列已经获得入网许可,型号分别为BNE-AL00、DCO-AL00、CET-AL...
日期:09-18
邬贺铨开讲啦5g观后感_邬贺铨院士:6G比5G快1000倍,有这个必要吗?
乐视高调宣布回归 将发布超级手机   文;| 张俊   本期嘉宾:   中国工程院院士;邬贺铨   这是一个新技术交汇的时代,AI、5G等前沿技术正在加速改变我们的生活。   在...
日期:08-19
拿下问界商标,华为要造一个汽车联盟?「华为汽车亮相」
  今年 3 月,任正非的一纸内部文件,重申华为不造车,"HUAWEI" 也被从问界宣传中撤下,这也让余承东想让问界借助华为品牌影响力实现销量腾飞的愿望落空。不过这并不妨碍华为对问...
日期:06-17
哔哩哔哩将于9月8日发布2022年第二季度财报(哔哩哔哩2018财报)
村网通是什么 查看最新行情   讯 北京时间8月18日晚间消息,在线娱乐平台哔哩哔哩(B站,Nasdaq:BILI,HKEX: 9626)今日宣布,将于美国东部时间2022年9月8日美国股...
日期:08-20
台积电3nm明年Q2后才会在iPhone新机拉货下开始逐月缓增
12月29日消息:据Digitimes报道,来自晶圆半导体设备厂商的消息,台积电预计从2023年中期开始大幅提高其3纳米芯片的产量,以满足多个客户的订单。华硕降临耳机降噪网易青果摄像机...
日期:12-29
蔚来李斌:2023年要新增1000座换电站,县城也要建_蔚来换电站遭强拆
2月21日消息,蔚来创始人、董事长、首席执行官李斌发文称,NIO Day上公布的2023年新增400座换电站的计划远远不够,我们确定了新的目标,决定2023年新增1,000座换电站,到2023年底累计...
日期:03-01
陆正耀、罗敏之后,预制菜还有多少故事可讲
  文 / 李丹昱  责编 /;高梦阳  编辑;/;梁又匀  在经历最初的火热之后,预制菜概念逐渐降温。  从近日预制菜板块表现来看,此前市场争相追捧的场景基本消失,预制菜概...
日期:09-08
官方认证“全国美食地图”来了:快看看你家乡上榜没「全国美食地区」
中国这么大,美食如此多,各地都有拿得出手的好吃的,3月29日,工信部、国家发展改革委等十一部门联合发布《关于培育传统优势食品产区和地方特色食品产业的指导意见》,除了具体的发...
日期:03-30
小米miui 13「小米13 Lite渲染图曝光:灵动岛来了?」
近日,将于海外市场开售的小米13 Lite渲染图曝光,这款手机的一个亮点是采用了类似iPhone 14 Pro的灵动岛设计,在屏幕正面设计了一个长条挖孔,不过这款手机的挖孔要小于iPhone的灵...
日期:02-15
增加安全功能 应用程序让iPhone易受攻击(苹果手机安全功能)
8月5日消息,据国外媒体报道,在最新版本的iPhone软件中苹果公司推出了一款非常重要的安全功能,然而该功能很少使用第三方应用软件,一般的应用容易使用户容易受到有针对性的攻击...
日期:07-22
Netflix《The Playlist》发布预告:一部关于Spotify崛起的剧集「netflix出品美剧」
Netflix已经发布了《The Playlist》--它即将推出的关于Spotify创建的节目--的官方预告片。这个近两分钟的预告片表明该节目将非常严肃地审视这个流媒体巨头如何建立其帝国。...
日期:10-03
《三体》剧版今日CCTV8、腾讯视频全网首播:会员提前看三集
备受书迷、科幻迷期待的《三体》电视剧将在今晚21:30全网首播,上线CCTV-8、腾讯视频等平台。今天上午,三体电视剧”官微率先公布了该剧的追剧日历。面板周期底部显现,龙头企业...
日期:01-15