您的位置:首页 > 互联网

文生图赛道又出黑马,爆火的Flux真能拳打Midjourney吗?(附对比实测)

发布时间:2024-08-15 10:46:50  来源:互联网     背景:

声明:本文来自于微信公众号 AI新榜,作者:月山橘,授权转载发布。

AI又一次击穿了现实,这次的主角是文生图赛道的黑马:FLUX

FLUX官网:https://blackforestlabs.ai/

先来看看最近在X上爆火的两个帖子:

乍一看还以为是什么大会颁奖典礼和TED Talk的现场,但事实上,这些都是FLUX生成的人物图片,用Runway Gen-3、Kling AI、Luma Dream Machine等“图生视频”的产物。

视频中人物的五官、皮肤的质感和光泽感、握着话筒的手、讲话时的手势和口型,不仔细看几乎看不出任何破绽,就连嘉宾证上的Google字样、背景板上的英文字母都清晰可辨。

不少网友把这种“真实”定义为“Flux realism(Flux现实主义)”。

还有专门的FLUX现实主义风格Lora:

https://replicate.com/fofr/flux-dev-realism

当看到AI生成的极为逼真的人物照片手掌上写着“I am not real”,属实被秀到了。

Flux AI图像正处在与现实无法区分的边缘,这些图像无疑是我见过的最逼真的AI图像。

这不是妥妥的户外运动产品的广告代言人吗?

于是有网友感慨:“这下模特们真要失业了。”

还有网友表示:我们正在进入一个不需要跟KOL付费合作的时代,品牌只需要用AI生成与他们的美学相匹配的influencer就行了。

看了这么多惊艳的效果图,这个横空出世的FLUX到底是什么来头?

原来,FLUX背后的AI初创公司黑森林实验室(Black Forest Labs),聚集了一群从Stable Diffusion出走的核心开发成员。这样看来,仅成立一年多就搞出这么大动静也就不足为奇了。

FLUX已经被玩疯了

自8月初发布以来,FLUX可以说是已经被网友们玩出花了。

1. FLUX+图生视频

其中最流行的玩法当然还是用FLUX生图,然后用Runway Gen-3、Kling AI、Luma Dream Machine等AI视频工具转成视频。

举牌求关注视频、自拍视角的Vlog、对镜拍视频、品牌高级感广告大片统统手到擒来。

这光影、这构图,还有模特的妆容和表现力,高级感拉满:

再加上配乐,充满异域风情的服饰、人物脸上热情洋溢的笑容,妥妥的文旅宣传片:

还有网友给视频进行了口型同步,这下AI YouTuber的春天怕不是要来了:

2. FLUX+局部重绘

还有人把FLUX和局部重绘相结合,只见他用笔刷选中怀里的金毛,然后输入提示词“小狮子”,金毛立马摇身一变成了小狮子,而且融合度非常高,手部细节也没有出错。

这小狮子一抱,连带着这个哥们的气质都变了,瞬间有一种迪拜富豪即视感。

感兴趣的玩家可以在HuggingFace上在线体验:

https://huggingface.co/spaces/SkalskiP/FLUX.1-inpaint

3. FLUX+Magnific AI

X网友“Javi Lopez”用AI图像增强软件Magnific对FLUX生成的图片进行了高清和放大处理,照片的真实感瞬间next level。

比如这张王室合照,在经过Magnific优化后,无论是皮肤纹理,还是发丝和光影效果都可谓与真人无异,人物神情也更为细腻。

当然,不止人像,插画、风景、食物、建筑等都可以用Magnific增强。

不过,Magnific AI现在开始收费了,而且还不便宜,每月39美元至299美元不等,不支持退款。

FLUX.1模型拥有12B参数,是目前已知最大的文生图模型,包含3个版本:

FLUX.1Pro:闭源模型,仅支持API调用,具备最佳性能,包括最先进的提示跟随能力、视觉质量、图像细节和输出多样性。可以注册官方API申请访问权限,同时支持企业定制 。

FLUX.1Dev:开源模型,不可商用,直接从FLUX.1pro蒸馏而来,具备相似的图像质量和提示词遵循能力,但更高效。

FLUX.1Schnell:开源模型,可商用,专门为本地开发和个人使用量身定制,生成速度最快,内存占用也最小 。

“AI新榜”本想下载安装到本地使用,无奈FLUX对电脑显存配置要求太高。

不过,得益于Flux模型的出色表现和开源优势,有很多平台和开发者已经完成了模型的部署,比如Fal.ai、Replicate、TensorArt、Krea.ai都已支持调用Flux模型,无需下载和部署。

另外,在国内的文生图社区和工具平台LibLib AI上,点击左侧边栏的“高级版生图”,也可以在线体验FLUX的Pro和Dev模型。

阿里也推出了FLUX的中文优化版,开发者可以在百炼大模型服务平台体验或调用FLUX模型。

值得一提的是,Black Forest Labs还表示正在开发新的生成式AI视频模型,为视频创作者提供更多的创意可能性。

FLUX vs Midjourney

我们用几组相同的提示词对FLUX和Midjourney进行了对比实测。

总的来说,FLUX基本可以和Midjourney(下文简称MJ)平起平坐了,甚至在一些方面超越了MJ,毕竟Flux开源。

具体而言,在文本内容的精确度、对提示词的理解上,FLUX略强于MJ。但在美学程度和风格多样性(尤其是艺术家风格)上,FLUX比MJ稍逊色些。

放上提示词和对比图,大家可以自行感受一下两者的差别(左Flux 右MJ):

Create an image of a man wearing a sharp, well-fitted suit, but instead of a regular head, he has a bright yellow balloon for a head. He is riding a bicycle through a serene urban park. The suit should be classic black with a crisp white shirt and a neatly tied tie, fitting him perfectly. The yellow balloon head should be shiny and slightly reflective, with a string tied around his neck like a bowtie. The bicycle should be a classic vintage style, adding a touch of whimsy to the scene. The park in the background should have lush green trees, a smoothly paved path, and a few park benches, creating a calm and pleasant atmosphere. The lighting should be soft and natural, as if it’s a sunny day.

左Flux 右MJ

A man with a head styled as a vintage TV set designed as a fish tank, water and fish inside the TV screen. He is sitting by the window on a vintage chair. The room is filled with retro furnishings, including antique furniture, old lamps, and vintage decorations. Realistic, detailed, cozy atmosphere,4K resolution

左Flux 右MJ

A charismatic speaker is captured mid-speech. He has short, tousled brown hair that's slightly messy on top. He has a round circle face, clean shaven, adorned with rounded rectangular-framed glasses with dark rims, is animated as he gestures with his left hand. He is holding a black microphone in his right hand, speaking passionately. The man is wearing a light grey sweater over a white t-shirt. He's also wearing a simple black lanyard hanging around his neck. The lanyard badge has the text "Flux". Behind him, there is a blurred background with a white banner containing logos and text (including Flux), a professional conference setting

左Flux 右MJ

Create an image of a cat in the style of a Vincent van Gogh painting. The cat should have expressive, swirling fur patterns in vibrant colors, reminiscent of van Gogh's famous brush strokes. Use bold and dynamic lines to depict the fur's texture and movement. The background should be equally rich in color and texture, with a night sky filled with swirling stars, similar to van Gogh's "Starry Night." The overall mood should be both whimsical and intense, capturing the unique essence of van Gogh's artistic style.

左Flux 右MJ

surrealist glitchy off-angle photography, a business man dressed in suit is waking up in a swamp after a party, bottles of wine and cigarettes, foggy atmosphere, in the style of H.P Lovecraft and Katsuhiro Otomo, incredibly detailed, cinematic shot, sharpen, hyper details, professional lighting, pale gradient colour palette

左Flux 右MJ

Createanimageofadark,eerieforestwithtowering,shadowytreesandthickunderbrush.Inthemidstoftheforest,depictasingle,brightstarshiningbrilliantlyinthesky,castingagentle,ethereallightdownthroughthecanopy.

上Flux 下MJ

像FLUX这样的模型所生成的逼真图像,确实引发了关于后真相时代(Post-Truth Era)的担忧。

无论如何,Flux.1的发布与开源对于推动文生图技术创新、提升模型质量、增加行业透明度、促进AI技术的普及与应用都意义重大。

正如Black Forest Labs在成立声明中说的那样:“透明度是建立信任和广泛采用的关键”,“我们相信生成式AI将成为所有未来技术的基础构建块。通过向广泛的受众提供我们的模型,我们希望将其好处带给每个人,教育公众,并增强对这些模型安全性的信任”。

美团王慧文是大连人


返回网站首页

本文评论
2024年高考第一个丢准考证的同学 网友:又开始了_高考准考试丢失
近日,一则关于“ 2024 年高考第一个丢准考证的同学”的消息登上微博热搜,引发了网友的广泛关注。据安徽公安在线官方微博报道, 6 月 3 日下午,市民程先生在购物时意外捡到了一张...
日期:06-05
传音手机是上市公司吗「传音手机又回来了!发布2023年第三季度报告,营收179亿」
传音控股发布2023年第三季度报告,实现营收179.93亿元,同比增长39.23%。其中,实现净利润17.83亿元,同比增长194.86%;实现扣非后净利润17.34亿元,同比增长189.97%。传音控股表示,公司...
日期:10-19
马斯克父亲自曝曾被请求捐精 以创造更多像长子那样的能人_遗产捐给马斯克
7月24日消息,特斯拉首席执行官埃隆·马斯克(Elon Musk)76岁的父亲埃罗尔(Errol)自曝,他曾被请求捐献精子,以创造更多像他长子那样的能人。埃罗尔声称,一家不愿透露身份的南美公司找...
日期:08-27
山东过年集体磕头「网友晒山东过年名场面:家族人共行磕头礼 仪式感拉满」
今天已经大年初二了,这两天过年不少地方都开放了烟花爆竹,走亲访友也是最近几年最适合的日子。有山东济宁网友晒出了自己除夕的硬核拜年礼仪,家族百来号人共同跪拜祖先,仪式感拉...
日期:01-24
极氪001被爆空调出风口白色粉末疑似导致车主妻子流产 官方回应:符合国标
3月7日消息,近日有极氪001车主在极氪APP发帖称,其购买的新车空调出风口附近出现白色粉末,并怀疑这些粉末导致其妻子怀孕后出现胚胎停止发育的情况。据该车主描述,它购买的新车是...
日期:03-07
苹果发布 Safari 浏览器技术预览版 141,修复 Bug 并提高性能_safari浏览器用不了什么原因?
  苹果近期发布了 Safari 技术预览版的新更新,这是苹果自 2016 年 3 月推出以来的实验性浏览器。苹果设计的 Safari 技术预览版是为了测试可能被引入 Safari 未来发布版本...
日期:04-11
欧盟共同数据空间对建设我国数据统一大市场的启示「欧盟新数据保护法生效在即 但只有两个成员国准备好了」
通信世界网消息(CWW)2020年2月,欧盟委员会发布欧洲数据战略,旨在创建一个单一市场,以便在欧盟范围内部有效、安全地跨行业跨领域共享和交换数据。这一努力的背后是欧盟委员会的目...
日期:08-04
3500万粉丝网红争端尘埃落定:浪胃仙账号仍属于原公司「浪胃仙真名叫什么」
去年,拥有3500万粉丝的吃播网红浪胃仙”账号引发争端,经过法院审理之后,账号被判属原公司。比亚迪方向盘怎么解锁资料显示,近日,重庆天权星文化传媒有限公司与浪胃仙(重庆)文化传媒...
日期:04-06
2022年第三季度印度智能手机出货量4460万部 小米位居首位_2019印度智能手机出货量
10月24日 消息:今日,科技市场独立分析机构Canalys发布报告称,2022年第三季度的印度智能手机出货量为4460万部,同比下降6%。2022年第三季度中国厂商在印度整体智能手机的市场份...
日期:10-27
生成式AI公司Galileo推出检索增强生成工具_ai生成技术
**划重点:**苹果官方ipad键盘1. 2018年特斯拉全球销量占比...
日期:02-07
小米是14薪吗「小米高管上手小米14 最快在本月底正式发布」
10月9日 消息:小米产品经理魏思琪透露,她已经拿到了小米14新品的试用机会,并对其中的人像样张赞不绝口。易车网汽车对比据悉,小米14预计将成为小米史上性能最强劲的旗舰手机,最...
日期:10-09
格力为什么比不过美的「跟美的、海尔比,格力真是掉队了」
作者|Eastland头图|视觉中国在国内外多重不利因素作用下,经济增长放缓、居民对未来收入的信心不足,社会消费总额下降。由于购买家电不是刚需(冰箱、洗衣机、电视机只要还能用,晚几...
日期:09-16
马斯克推特简介改为比特币「马斯克:收购推特不为赚钱 希望打造受人尊敬的广告平台」
10月28日消息,特斯拉CEO马斯克已经以440亿美元完成了将推特私有化交易,并将自己的推特账号介绍改为推特老板”。马斯克在推特上发文表示,有关他为什么收购推特的大部分猜测都是...
日期:10-29
百度地图上线“自动驾驶级”导航功能,你或许不会再错过绿灯_百度地图导航模式
记者/伍洋宇   8月12日,百度地图联合Apollo在北京市高级别自动驾驶示范区发布全新版本,首先在亦庄上线车道级导航、车位级导航,以及绿灯畅行导航等智能化功能,这些功能也将在...
日期:08-12
中国信科陈山枝:6G三大突破与三大标志_中国信科集团陈山枝
通信世界网消息(CWW)6月28日,在MWC大会 “6G愿景及关键推动力”的专题会议上,中国信科副总经理、总工程师、科技委主任陈山枝博士发表了题为《6G三大突破与三大标志》的主题演讲...
日期:06-30
南京阿姨手冲咖啡爆火却遭逃单 网友表示要寻找逃单者_南京手冲咖啡店
南京近期因一家由阿姨经营的咖啡店成为了网友们的热议焦点。这家咖啡店并非因其精致的装潢或复杂的咖啡工艺而走红,而是源于一位女网友在社交平台上的分享,其内容却是对阿姨简...
日期:05-20
国人买iPhone的还是多!报告显示今年618手机销量:苹果第一、小米荣耀前三
快科技6月27日消息,一年一次的618大促已经过去,相比去年来说,今年手机厂商都低调很多,到底他们都卖出了多少手机呢?天玑8100真的比骁龙8强嘛ai虚拟现实调研机构TechInsights给出...
日期:06-27
iPhone AI图像编辑P图app工具免费在线使用地址 苹果MGIE开源模型官网体验入口
MGIE是一项由苹果开源的技术,利用多模态大型语言模型(MLLMs)生成图像编辑指令,通过端到端训练,捕捉视觉想象力并执行图像处理操作,使图像编辑更加智能、直观。点击前往MGIE官网体...
日期:02-06
2020苹果手机壳最新款「iPhone 15系列手机壳上架官网:399元」
苹果2023秋季新品发布会于9月13日凌晨举行,会上,苹果发布了新一代iPhone 15系列,共四款机型,售价从5999元起,将于9月15日开始预售。 新机发布后,苹果中国官网立即同步上架了...
日期:09-14
2020年移动5g套餐资费一览表「中国移动 5 月 5G 套餐用户数突破 7 亿」
根据中国移动发布的公告,截至5月末,该公司移动业务客户总数约为9.83亿户,5月净增32.5万户,5G套餐客户数约为7.07亿户。同时,该公司有线宽带业务客户总数约为2.84亿户,5月净增166.2...
日期:06-23