您的位置:首页 > 互联网

超越恐怖谷!全球500万网友被骗,爆火TEDx演讲者没一个是真人?_ted知名演讲视频

发布时间:2024-08-11 10:40:07  来源:互联网     背景:

声明:本文来自于微信公众号 新智元,作者:新智元,授权转载发布。

【新智元导读】最近,这几位TED演讲者,在外网形成了病毒式传播,然而,他们竟然全都不是真人?!答案揭晓后,五百万网友简直惊掉下巴。这5张图里,你能发现几个bug?

最近,这些TED演讲者在外网火得一塌糊涂,堪称病毒式传播。

仔细看看,你能发现什么问题吗?

答案揭晓——这五个人中,没有一个是真人!

在线寻人的小哥要哭了

如此逼真,几乎毫无破绽,这种级别的生图AI直接让网友们惊掉下巴。

甚至连AI识别软件,都认不出来这是AI生成的图。

看起来真实,难道不是因为本来就是真实的照片?

没有一张是真人吗?简直令人毛骨悚然!

网友锐评:这已经超越了恐怖谷,到达了超真实谷。

短短十几个小时,分享这张图片的帖子,在推上的观看人数已经破了500万。

随后,作者也被扒了出来——他就是Stable Diffusion团队的前成员Leo Kadieff。

他揭秘道:这些TEDx演讲者,都是用最新的Flux真实版LoRA制作的。

以往的AI生图,人眼多少都会看出违和感,而这次的图片如此逼真,正是靠LoRA技术改进了模型,才大大增加了真实感。

并且,作者介绍说,这个工作流还有一个好处,就是大大简化了复杂的提示词。

这个消息,简直让提示词苦手们狂喜。

这个小小的22MB文件,就可以让我们省去麻烦,不必再在每个提示词中写一堆与真实性相关的Token。

一句一张RAW超现实主义照片,UHD,8k,足矣。现实主义爱好者,绝对爱死了这个工具。

作者直言:我们还需要对现实模型进行微调吗?

- 这些图像是Flux+LoRA的原始输出,未经过任何放大或后期处理

- 你需要对应的RealismLora文件,以及ComfyUI工作流

Lora:https://huggingface.co/XLabs-AI/flux-RealismLora/tree/main

ComfuUI:https://we.tl/t-zrC5tPFG17

真实版LoRA,效果拔群

从下面这两幅图中不难看出,用LoRA和不用LoRA的效果对比,果然十分明显。

网友已玩嗨

与此同时,TED演讲者的分享者Kyrannio,也尝试用Midjourney复刻了一波。

最初的提示词如下:

一位女性在舞台上发言,来自谷歌,白色背景,企业标志被模糊处理,科技会议 --style raw --v6.1

可以看出,生成效果还不错,但与Leo Kadieff生成的图片差距依然很大。

接着,博主又进行了一些改进:

一位年轻女性微笑着在舞台上发言,来自谷歌,白色背景,企业标志被模糊处理,科技会议 --style raw --v6.1

并在经过多次生成之后,试出了最为接近的结果:

与此同时,随着谷歌Imagen3公开可用,网友们也在第一时间拿着这套prompt进行了尝试。

一时间,全网都掀起AI生图的热潮。

Imagen3全员可用

没错,正如刚刚提到的,谷歌最强文生图模型Imagen3已经正式开放可用了。

prompt:Photo of a man holding a sign that says: "Imagen Is Now Almost As Good As Midjourney" in New York City.

来源:Risphere

网友chrypnotoad表示,自己还没见过哪个AI能把阿喀琉斯之盾做得这么好的!

台湾为什么摩托车多,没有电动车

能轻松hold住如此复杂的prompt,Imagen3果然不能小觑。

知名博主歸藏在体验之后表示:

生成的内容准确但图片美观度很差。只要涉及人物,你就得仔细斟酌提示词写法,不然大概率无法出图。

好在,他们在提示词的交互上做得很好:

LLM会分析提示词类型,并且给出相关词语你可以直接切换。

来源:歸藏

除了直接生成之外,Imagen3还支持局部重绘功能,用画笔和提示词对图片进行编辑。

来源:歸藏

当然,几家顶流文生图AI的PK,肯定也少不了:Midjourney V6vs Imagen3vs FLU.1[pro]。

异色瞳的亚洲女性。

美洲原住民。

有美人痣的南亚妇女。

疯狂的艺术家。

很遗憾,谷歌大概因为安全设置过于敏感,并不能生成这个prompt……

留着八字胡的高加索老人。

Runway也来蹭了一波,但…

趁着这股热度,Runway创意总监Nicolas Neubert,还用自家的Gen-3Alpha生成了一段视频。

果然,AI图片变成视频后,效果依然杠杠的!

而这个帖子,也同样引起了轰动。

网友赞叹道:从一年半前惨不忍睹的威尔·史密斯吃意面,到今天这个程度,进步可谓是疯狂的。

同时,也有火眼金睛的网友发现,这个视频依然有一些细微的bug。

比如人的舌头不会动,牙齿有些弯曲、扁平,第4秒时左臂出现了奇怪的斑点,还有Google标志处的bug,也非常明显。

如果看得再仔细点,会发现所有的阴影都很不自然,比如麦克风的阴影。还有东西接触的地方,很多线条是乱的。

嘴唇的动作也不自然。

眼睛看起来仍然没有灵魂。

总的来说,相比于AI生图,目前AI视频的bug显然要多得多。

背后的原因还是在于,AI根本不理解人类的舌头、头发、眼睛究竟是什么东西。接下来的AI,还是要学会人体解剖和物理学才行。

而且,在文生图这块,Runway就要差得多了。

SD一作携原班人马创业,一出手就是王炸

说回到FLUX.1,其实在8月初的时候它就引起过一波热议。

Stable Diffusion一作、Stabililty AI核心成员Robin Rombach下场创业,官宣成立Black Forest Labs。

祭出的首个产品FLUX.1系列模型,效果直接秒杀Midjourney、DALL-E和Stable Diffusion!

根据官博的介绍,FLUX.1在图像细节、提示词遵循、风格多样性和场景复杂性方面都取得了SOTA。

尤其是FLUX.1[pro],经过测试在一众文生图模型中拔得头筹。

视觉质量、提示词遵循、尺寸/纵横比变化、排版和输出多样性

商城限时秒杀回购被骗经历

ELO得分

ted超级演讲

为了在可访问性和模型能力之间取得平衡,FLUX.1有三种变体:FLUX.1[pro]、FLUX.1[dev]和FLUX.1[schnell]:

- FLUX.1[pro]:FLUX.1的顶级版本,提供最先进的图像生成,具有一流的提示词跟随能力、视觉质量、图像细节和输出多样性。

- FLUX.1[dev]是一个开放权重的指令蒸馏模型,用于非商业应用。由于是从FLUX.1[pro]直接蒸馏而来,因此FLUX.1[dev]不仅获得了强大的质量和提示词跟随能力,而且比同规模的标准模型更加高效。

- FLUX.1[schnell]是最快的模型,专为本地开发和个人使用而设计。(schnell在德语中就是快的意思)

值得一提的是,所有FLUX.1模型都基于多模态和并行扩散Transformer块的混合架构,参数规模为120亿。

其中,团队通过构建流匹配(flow matching)改进了之前的扩散模型,并且通过结合旋转位置嵌入(rotary positional embeddings)和并行注意力层提高了模型性能和改进硬件效率。

团队成员

扒开Black Forest Labs主页,可以看到团队共有15位成员。

创始人正是老熟人Robin Rombach。

Stability AI曾收购了Robin的Latent Diffusion模型,并聘请他成为首席科学家。

在Google Scholar网站上,Robin Rombach参与论文《High-Resolution Image Synthesis With Latent Diffusion Models》已经收获了9000多次引用。

期间他领导了全球著名文生图开源项目Stable Diffusion系列,这也是全球下载最多、使用最广的开源大模型之一。

论文地址:https://arxiv.org/pdf/2112.10752

Andreas Blattmann、Patrick Esser、Dominik Lorenz三人皆是SD论文作者,也是Black Forest Labs创业团队的新成员。

除了Bjorn Ommer,可以说Robin将SD核心元老全都带走了。

《Fast High-Resolution Image Synthesis with Latent Adversarial Diffusion Distillation》,正收Robin离职前发表的最后一篇论文。

论文地址:https://arxiv.org/abs/2403.12015

值得一提的是,在这篇论文中,Andreas Blattmann、Tim Dockhorn、Axel Sauer、Frederic Boesel、Patrick Esser也参与了其中。

除此以外,新团队曾经的创新成果包括创建VQGAN和潜在扩散(Latent Diffusion)、用于图像和视频生成的SD模型(SD XL 、SVD)以及用于超快速实时图像合成的对抗扩散蒸馏(Adversarial Diffusion Distillation)。

看来,AI生图和视频的进步速度,还在不断加快。

再过一年,我们能看到的AI图片和视频,将是惊人的。

参考资料:

https://x.com/koltregaskes/status/1821984829065588891

https://x.com/doganuraldesign/status/1821992421770850523

https://www.reddit.com/r/StableDiffusion/comments/1emrprx/feel_the_difference_between_using_flux_with/

https://www.linkedin.com/posts/leokadieff_ai-generativeai-filmmaking-activity-7227322182920536066-K980/#


返回网站首页

本文评论
收购靴子落地!斥资最高4.86亿元亿收购Samton,新纽科技或迎来全方位升级
  8月15日,国内领先的金融IT方案解决提供商新纽科技(09600.HK)发布公告,将以最高4.86亿元的价格收购Samton (Cayman) Holdings Limited(下称“Samton”)100%股权,Samton的境...
日期:07-17
日本机器人初创公司 Telexistence融资1.7 亿美元 软银领投
7月7日 消息:日本机器人初创公司Telexistence宣布获得由软银、Airbus Ventures、Monoful Partners、KDDI Open Innovation Fund、富士康和Globis Capital Partners等机构共...
日期:07-07
营收确已破万亿,中国移动未来如何与自己赛跑?_中国移动未来发展战略
通信世界网消息(CWW)新年伊始,从中国移动传来两大消息。第一,截至2023年12月,中国移动的移动用户数达到9.91亿户,与10亿“里程碑”仅半步之遥;第二,在近期举办的行业会议上,中国移动...
日期:01-23
发挥自身优势 科大讯飞将向疫情一线提供智能语音外呼服务(科大飞讯是中国智能语音行业的领导者)
  一场来势汹汹的新型冠状病毒感染肺炎疫情打乱了鼠年春节本该平和的步调。面对这场突如其来的灾难,全国上下各方联防联控,展开了一场众志成城的疫情防控狙击战。   就在...
日期:09-25
陆正耀、罗敏之后,预制菜还有多少故事可讲
  文 / 李丹昱  责编 /;高梦阳  编辑;/;梁又匀  在经历最初的火热之后,预制菜概念逐渐降温。  从近日预制菜板块表现来看,此前市场争相追捧的场景基本消失,预制菜概...
日期:09-08
微软承认Windows Phone包含不恰当的定位跟踪数据返回
  微软今天低调地确认了之前程序员Rafael Rivera发现的位于Windows Phone中有关位置数据的问题,这名程序员之前撰文指出,WP7系统会向Live.com服务器发回MAC地址、信号塔、G...
日期:07-23
蚂蚁集团调整「为补充员工激励池及满足股东流动性,蚂蚁集团启动股份回购」
7月7日晚间,金融管理部门宣布,已善始善终推进平台企业金融业务整改,工作重点转入常态化监管。蚂蚁集团也完成整改进入发展新阶段。一点资讯创始人郑朝晖现在哪里7月8日上午消息...
日期:07-08
腾讯前三季度利润「腾讯三季度营收1400.93亿元 净利润399.43亿元」
11月16日消息,腾讯控股发布2022年第三季度财报,财报显示,腾讯控股第三季度营收1400.93亿元,同比下滑2%;公司权益持有人应占盈利399.43亿元,同比增长1%;非国际财务报告准则下净利...
日期:11-19
sublime text最新版本_Sublime Text 4 首个稳定版发布:全新 UI、多选项卡、支持苹果 M1
  5 月 23 日消息 Sublime Text 4 首个稳定版正式发布,本次大版本更新带来了全新的 UI、实用的的多选项卡功能、更强大的代码自动补全,并正式支持了苹果 M1 平台和 Linux A...
日期:12-16
“薛之谦盗摄”上热搜背后,要注意“反屏摄”而非“反分享”_为薛之谦霸屏
声明:本文来自于微信公众号 读娱(ID:yiqiduyu),作者:零壹,授权转载发布。2月15日下午,薛之谦在微博发布了一段题为“偷看”的《飞驰人生2》观后感,长文内容是一贯的薛之谦式幽默文...
日期:02-17
数字孪生公共服务平台上线试运行_数字孪生管理平台
通信世界网消息(CWW)为推动数字孪生产业高质量发展,近日,由中国信息通信研究院(简称“中国信通院”)和苏州工业园区管委会联合建设的数字孪生公共服务平台(https://www.cndigitwin....
日期:08-05
vivox系列曲面屏「vivo X100系列首发8T护眼微曲屏:120Hz高刷、3000nit峰值亮度」
快科技11月13日消息,vivo X100系列发布会正在进行中,官方公布了新机的屏幕信息,vivo X100系列首发超视网膜8T护眼微曲屏。据介绍,这块屏幕峰值亮度高达3000nit,运用8T LTPO背板技...
日期:11-14
暖宝宝爆炸烫伤怎么赔偿「女子网购电暖宝遭炸伤毁容:卖家只愿赔医药费」
11月14日消息,据澎湃新闻报道,董女士去年12月25日在使用网购电暖宝取暖时被电弧灼伤,爆炸导致其面部毁容、眼角膜视神经被灼伤,双眼视力从原来的1.2降为了现在的低视力0.05(矫正...
日期:11-16
Meta已成功修复问题-Facebook和Instagram全球死机_facebook全球宕机
周二,Meta 宣布已成功解决其旗下 Facebook、Instagram 和 Threads 服务的中断问题,此前这些问题导致部分美国用户长时间无法登录这些平台。在周二上午的服务中断期间,Meta 通信...
日期:03-06
极致轻薄!荣耀V Purse折叠屏手机发布_荣耀折叠屏手机价格
荣耀V Purse折叠屏手机正式亮相,该款手机再次刷新了折叠屏手机的轻薄纪录。据悉,荣耀V Purse折叠后厚度仅为8.6mm,展开后厚度为4.3mm,是目前行业内最薄的折叠屏手机,堪称“手机界...
日期:09-20
iphone 14什么时候发售「iPhone 14 Plus开售两周 现已跌破6000了!」
10月7日iPhone 14 Plus首销,然而是个了两周不到,iPhone 14已经从6999元的发售价跌到了5950元,跌幅有1000多元,而512G版本已经从9699元跌倒了7000多元,跌幅有1700多元。台式电脑连...
日期:10-21
只卖贵的!NVIDIA或放弃千元甜点卡市场:留给AMD、Intel自己玩
最近有消息称NVIDIA已经停产了RTX 2060/2060S/GTX 1660等甜点卡”,主要精力将完全转移到RTX 30和40系上来。2022年dji新品发布会虽然真实性还有待验证,不过一些渠道的RTX 2060...
日期:12-02
25万美元一趟值吗?致5死泰坦号潜艇内部曝光:没凳子只能盘腿坐 马桶是最佳座位
快科技6月23日消息,考察泰坦尼克”号邮轮残骸的美国深海潜水器泰坦号”由于在下潜过程中发生灾难性内爆”,导致5名乘员全部死亡。事故发生后,潜艇的内部构造引发外界关注。据报...
日期:06-23
赵明:荣耀手机端侧AI远远领先所有 有的品牌只会平移别人的_荣耀手机有侧边栏功能吗
快科技7月13日消息,昨天下午荣耀Magic V3正式发布,首发AI离焦护眼技术以及干眼友好绿洲护眼技术。这些技术能智能识别干眼风险并主动调节,缓解视觉疲劳,号称开启功能阅读25分钟...
日期:07-13
美监管机构警告特斯拉车主:别拿孩子测试自动驾驶安全性(美国对特斯拉自动驾驶调查)
8月18日消息,美国汽车安全监管机构周三向特斯拉车主发出警告,不要利用自家孩子测试自动驾驶功能。美国国家公路交通安全管理局(NHTSA)表示,特斯拉使用的是受控程序,“任何人试图自...
日期:08-19