您的位置:首页 > 互联网

AI开卷视频:一句话一张图就能出大片,“人均诺兰”时代不远了

发布时间:2023-09-14 16:34:53  来源:互联网     背景:

声明:本文来自于微信公众号硅星人Pro(ID:gh_c0bb185caa8d),文| Nikki编辑| VickyXiao,授权转载发布。

当我们还在讨论ChatGPT和AI绘画时,AIGC的圈子里又刷新了一些新玩法。

只见大叔打个响指,摇身一变成贵族,穿越到了17、18世界的欧洲宫廷。

随后,又一个响指,变成了「星球崛起」里的主角,在残垣断壁的战场上穿梭。

这还不算最神奇的,紧接着一个转场,打响指的人物从老爷子变成了健美女性。

这个爆款视频正是通过AI初创公司Runway制作而成的,他们的AI视频生成产品Gen-1和Gen-2已全面开放,任何人都可以注册一个账号免费尝试。目前网站上可试用功能比较多,其中应用最多的是:文字+图像生成视频(Text + Image to Video)、图像生成视频(Image to Video),升级版效果比之前更好。

于是很多网友探索出了用Midjourney生成图像,然后用Gen-2把图像转化为视频的玩法。

甚至在此基础上,还能融合连贯的剧情和统一的艺术风格,再对视频画面进行一定编辑,一个电影预告片就诞生了,让我们一起来看看用Gen-2整活,究竟可以出多少脑洞?这些视频创意又是如何生成的?又有哪些技术原理呢?

01令人惊叹的《创世纪》电影预告片

由 Nicolas Neubert创作的《创世纪》电影预告片的视觉震撼力吸引了许多人,据了解,这是作者使用Midjourney和Runway制作出来的。再将其进行剪辑优化,最终成为一条专业的预告片。

很多人在推特上询问Neubert的制作步骤,他后续也在推文中详细介绍了灵感来源和创作过程。首先他是从配乐开始构思整个故事,然后再剪辑时将视觉效果与音乐节拍进行匹配。

对于具体的故事情节,他想一步步增强紧张感,所以分成了3个部分来完成:背景介绍、制作冲突、引入高潮。

第一步就是起草文案,将“Sharing everything, living with the consequences, and then calling humanity up for action”作为主题,通过这个主题来定后面的整体基调和声音,然后就可以围绕这些主题去生成场景,在阅读观看大量关于军事科技、战斗主题的科幻剪辑后,最后确认了故事线,为了使影片看起来更加有深度,他还添加了三个带有发光护身符孩子的镜头,提高故事深度。

第二步是用Midjourney生成一致的图像。为了最大限度地保持一致性,他拟了一个提示词模板,可以在预告片的每个镜头中重复使用。

“Cinematic Shot, Crystal Object in the middle of circular room, star wars warfare, earthy naturalism, teal and yellow, frostpunk, interior scenes, cinestill50d --ar21:9—style raw”

“电影镜头,圆形房间中间的水晶物体,星球大战战争,朴实的自然主义,青色和黄色,霜朋克,室内场景,cinestill50d --ar21:9—风格原始”

closeup shot of raising a blade, detailed face, star wars warfare, cinematic contour lighting, in the style of detailed crowd scenes, earthy naturalism, teal and yellow, frostpunk, interior scenes, cinestill50d --ar21:9—style raw

Huge laser cannon beam, star wars warfare, cinematic contour lighting, in the style of detailed crowd scenes, earthy naturalism, teal and yellow, frostpunk, interior scenes, cinestill50d --ar21:9—style raw

Humans attached to computer by wired, detailed face, star wars warfare, cinematic contour lighting, in the style of detailed crowd scenes, earthy naturalism, teal and yellow, frostpunk, interior scenes, cinestill50d --ar21:9—style raw

使用 "Strong Variations "功能也很有帮助。这使得创建多样化场景变得容易,同时还能保持前一个变体的色调。女战士的场景可以转变为普通市民、网络黑客或战斗场景,而无需生成新的提示。

第三步是用Runway生成动画。勾选“Upscaled”可以提升画质(这个选项需要付费使用),但可能面部处理得不好,所以他通常使用标准质量,基本都是用图像直接生成一个个视频镜头。

第四步是在CapCut(免费软件)上进行后期剪辑。他将生成的镜头卡着音乐节奏拖入时间轴,慢慢拼凑出完整的故事。同时还要对2-3个剪辑包进行颜色匹配,使得它们看起来更像一个电影场景。

华为mate50卫星电话

最终,他花费了大约7个小时完成这部预告片,其中在Midjourney输入了316个提示词,放大了128个图像,在Runway生成了310个视频片段,预告片使用了44个片段,相当于每分钟的制作成本是125美元。

02火爆外网的AI影片「芭本海默」

最近在外网有个词特别火:「芭本海默」(Barbenheimer),是由网友用AI生成的《芭比》和《奥本海默》拼接而成的电影预告片——《Barbenheimer》(芭本海默)在网络上广泛传播。

视频作者表示此预告片由Midjourney和Runway的Gen-2合成,配音也是由AI生成的玛格特·罗比和马特·达蒙的声音。更令人惊讶的是,整个制作过程他只花了4天!

新能源汽车危险性

万万没想的是这些超燃超真实的预告片画面竟然都是用AI生成的,这些预告片中的画面皆是由Midjourney生成,然后再通过Runway的Gen-2来实现让画面动起来的视觉效果。

而此次爆炸性效果让更多人尝试用Midjourney和Gen-2混搭,也二创出了超多优秀作品。由于Gen-2生成的视频时长比较短,甚至还有网友找到了Gen-2输出更长时间视频的方法,就是用Midjourney生成的图像作为初始图像,然后使用Gen-2输出的最后一帧作为下一张的图像提示。

03AI视频打破次元壁,让梗图动起来

之前也有一些工具能够给图像添加动效,但都只是让图像的某些部分动起来,例如让老照片说话,前段时间DragGan的技术再现,都是通过对图像的部分进行移动,而此次Runway可以做到让AI来根据图像内容想象动态场景,其创意脑洞可以说是无限的。

许多网友也进行了二次创作,把一些搞笑梗图融合起来,就是一部电影故事。例如这位网友用Midjourney和Gen-2生成了一个电影短片,让美国知名政治人物、企业家齐上阵,出演由恶魔伪装的人类。

我们可以在片中看到许多熟悉的面孔:特朗普、拜登、希拉里、马斯克、扎克伯格……他们似乎在共同密谋着什么邪恶计划。

借助AI,人们可以发挥想象,创造出原本现实中不存在的人物动作和故事情节。除了电影和整活视频之外,还有人利用ChatGPT写脚本,Midjourney生成图像,Runway Gen-2生成视频,然后再通过剪辑组合,就是一个高质量的广告片。

04视频生成技术发展的关键阶段

看到这里,你肯定要感叹AI视频的技术已经这么成熟了,甚至让好莱坞电影制作方都要开始担忧了。但其实目前Runway的视频生成还是不能一步到位,无法生成更长片段的视频,并且人物面部、动作变形问题等还是不太可控。如果真的要制作一个完整的电影或者广告片,你可能要花费更多的时间去不短尝试使用它。

视频生成的技术发展至今,其实大致可以分为图像拼接生成、GAN/VAE/Flow-based生成、自回归和扩散模型生成几个关键阶段。随着深度学习的发展,视频生成无论在画质、长度、连贯性等方面都有了很大提升。但由于视频数据的复杂性高,相较于语言生成和图像生成,视频生成技术当前仍处于探索期,各类算法和模型都存在一定的局限性。

Runway就是使用的主流模型Gen,Gen模型通过潜在扩散模型学习文本-图像特征,可以根据给定的文本提示或参考图像生成新的视频,或根据原始视频+驱动图像进行视频风格转换等多种任务。模型在视频渲染和风格转换方面具有较好的表现,生成的视频艺术性和图像结构保持能力较强,因此可以更好地适应模型定制要求,但Gen模型在生成结果的稳定性方面仍然存在局限,还需要技术去不断探索精进,按现如今AI技术的发展,相信这些局限性在不久的将来就能解决。

除了Runway,市面上还有一些支持文字生成视频、图片生成视频的工具,比如ZeroScope、PikaLab、Kaiber等,以目前AI视频的处理效果来看,是否能达到商业应用要求,还有待考究。

你对AI视频技术怎么看?欢迎在评论处留言与我们互动。


返回网站首页

本文评论
天猫总裁夫人微博喊话如涵老板张大奕,小三?破坏家庭!(张大奕和天猫总裁夫人)
  阿里今日发布蒋凡调查声明,确认与如涵和张大奕无利益输送张大奕是谁?张大奕,中国第一网红,作为模特出道的她还是淘宝素颜大赛第一名得主,具有超强的时尚嗅觉,穿搭能力...
日期:05-07
56岁保安写出40余万字长篇小说被网友狂赞:已开写第三部长篇小说
武汉体育学院的一名保安居然创作出了长篇小说,而且还顺利出版,这确实不简单。雅虎为什么卖掉阿里巴巴股份今年5月,李世伟收到了出版社寄来的长篇小说《村庄的大地》。这部40余...
日期:05-29
极光二手手机行业研究报告:疫情或将加速交易线上化(极光大数据:2018年Q2智能手机行业研究报告)
  极光 (Aurora Mobile, NASDAQ:JG) 发布《二手手机行业研究报告》,从二手手机行业背景、线上二手手机交易/回收平台、主要二手手机交易 app 核心数据排名等方面洞察二手...
日期:09-05
游戏公司回应亮剑不充值打不过鬼子:不是我们开发的「游戏亮剑怎么玩」
一款以《亮剑》为IP的抗日游戏因需要充值才能战胜日本士兵而引起玩家不满,指责开发商中青宝公司。智慧屏量子点后来,中青宝公司发表声明澄清称该游戏不是由他们研发和运营的,该...
日期:04-27
百度地图“数说”节后复工首月城市拥堵排名 沪京杭交通活跃度明显上升
  随着新冠肺炎疫情得到有效控制,全国各地已陆续开启复工复产。近日,百度地图发布了全国37个主要城市春节假期后复工首月的拥堵数据及排名,以侧面反映各城市复工复产后通勤...
日期:12-26
消息称三星电视业务去库存已有成效,手机方面仍状况不佳_网易订阅
IT之家8 月 29 日消息,由于近几个月消费性电子市场的萎缩,许多厂商的手机、电视等业务都受到不同程度的影响,囤积了不少产品。厂商们为了清理库存,往往会通知供应链暂停采购。go...
日期:08-29
BOSS直聘向港交所递交双重主要上市申请「港交所提交上市申请」
凤凰网科技讯 10月10日消息,BOSS直聘(NASDAQ:BZ)向香港联交所递交双重主要上市申请。摩根士丹利、高盛担任联席保荐人。双重主要上市流程完成后,BOSS直聘将成为同时在美国纳斯达...
日期:10-11
高通被判违反垄断法 将改变全球智能手机格局_高通反垄断案的影响
  在赢得了与苹果专利纠纷胜利刚满一个月后,高通便收到了一纸败诉,受此影响,高通美股盘前股价暴跌12%。   据《华尔街日报》5月22日报道,美国加州圣何塞北区联邦法官在当...
日期:12-17
17岁少女晒爸爸500元买的奢侈包包遭群讽 含泪反击 结局暖心
新加坡一位亚裔少女Zoe,最近迎来了17岁生日,爸爸送给她一个Charles Keith包包。女孩在TikTok上晒出视频,感谢爸爸,让她拥有了人生第一个大牌包。没想到,很多网友纷纷评论Charles...
日期:01-17
人类创造的数据太贵了!开发者悄悄使用AI合成数据训练模型_数据合成工具
新智元报道编辑:Aeneas【新智元导读】人类数据快耗尽了,怎么训练更高级的AI?很多公司,已经在悄悄使用AI合成的数据来训练AI模型了。现在,开发者都在悄悄使用AI生成的数据来训练AI...
日期:08-01
百度推出AI志愿助手 为考生提供考后服务_百度ai志愿助手2021
6月30日 消息:百度宣布推出「百分百计划」,为考生提供AI志愿助手、院校专业对比、高考热搜大数据、高校咨询等服务。华为荣耀50是麒麟芯片吗据悉,今年百度全新升级了「AI志愿...
日期:06-30
箱包流行趋势「欧美疯抢中国箱包 订单已排到明年:爆发式增长」
国产箱包,在海外市场火了。据央视报道,统计数据显示,今年1-8月,我国箱包出口总额为1487.1亿元,同比增长30.6%。华为完爆苹果小爱同学有没有朗读功能今年1-5月份,我国箱包出口额127...
日期:10-16
安徽一高校录取通知书出现错字 6日写成6月:官方回复又有错字_录取通知书里面印错了
进入8月,距离准大学生们开学的日子越来越近,各个高校的录取通知书也基本发放差不多了。不过,安徽巢湖学院发出的录取通知书上,赫然一处错别字,将报到时间中的9月6日”,写成了9月6...
日期:08-07
北大教授陈钟谈 AI 未来:逼近 AGI、融进元宇宙,开源是重中之重!
声明:本文来自于微信公众号CSDN(ID:CSDNnews)),受访者 | 陈钟 采访者 | 唐小引作者|郑 丽 媛,授权转载发布。去年11月底 ChatGPT 横空出世时,可能谁也没想到,一场规模庞大的变革将...
日期:05-24
荣耀Magic 5曝光:2亿像素 3000多价位年底发布「荣耀magic2像素怎么样」
荣耀Magic 5手机的消息又传出了,消息称新机将搭载骁龙8 Gen2芯片,这颗芯片将在在下个月高通发布会中正式推出,目前荣耀已经开始试产,并且已经即将开始多场景的真机测试,目前荣耀M...
日期:11-08
IDC调研显示:百度EasyDL再获中国机器学习平台市场份额第一
  AI时代下,中国底层战略性技术的力量在不断被巩固。   近日,全球权威咨询机构IDC(国际数据公司)发布了中国《深度学习框架和平台市场份额》报告,着重从用户选择、行业分...
日期:07-16
外媒:中国恒大拟在12月初提交重组方案 可能对汽车子公司实施债转股
11月24日消息,据国外媒体报道,知情人士称,中国恒大集团已经通知境外债权人,计划最早在12月的第一周提交重组方案。苹果电池续航外媒称,重组方案可能包括对中国恒大旗下子公司恒大...
日期:11-25
智能车速控制的理解「Mobileye发布首个纯视觉智能车速辅助系统」
通信世界网消息(CWW)Mobileye全新标志检测技术正式通过了欧洲的审批,这是首个符合全新欧盟法规要求的纯视觉解决方案,计划于2023年第四季度量产。redmi k50什么时候出 2023年7...
日期:07-19
iPhone 15/16系支持高通基带 爆未来iPhone采用自研5G基带芯片「iphone13集成5g基带」
此前爆料称,苹果将为未来的iPhone自研5G基带芯片,但据预测,高通仍将是所有iPhone 15和iPhone 16系列机型的调制解调器供应商,这表明苹果的基带芯片至少要到2025年才会亮相。海通...
日期:10-09
小鹏电动汽车的电池「小鹏汽车回应计划自研电池:是没有的事」
11月28日 消息:今日,针对“小计划自研电池”的报道,小鹏汽车回应称,人事变动属实,自研电池没有的事。此前,有媒体报道称,小鹏汽车也将自研电池提上议程,目前已经招募前宝马高级电池...
日期:12-04