您的位置:首页 > 媒体评论

用嘴做视频真来了!Meta这个新应用太逆天了

发布时间:2022-10-06 02:03:44  来源:互联网     背景:

周杰伦隐藏新歌、苹果头显名称曝光,还有蜜雪冰城回应茶包有虫、《间谍过家家 2》即将开播......

今年,是 AI 在图像视频制作领域进步很大的一年。

有人拿着 AI 生成的图像拿走了数字艺术大奖,战胜了一众人类艺术家;有 Tiktok 这样的应用通过文字输入生成图片,变为短视频的绿幕背景;还有新的产品可以做到文字直接生成视频,直接实现「用嘴做视频」的效果。

这次的产品来自深耕人工智能多年,前段时间才因为元宇宙被疯狂嘲讽的 Meta。

Meta 元宇宙曾被疯狂嘲讽

只是这次,你不能嘲讽它了,因为它真的有了小突破。

文字转视频,能做成什么样

现在,你可以动嘴做视频了。

这话虽然有点夸张,但 Meta 这次推出的 Make-A-Video 恐怕真是朝着这个目标前进的。

目前 Make-A-Video 可以做到的是:

文字直接生成视频——将你的想象力变成真实的、独一无二的视频

图片直接转为视频——让单一图片或两张图片自然地动起来

视频生成延伸视频——输入一个视频创建视频变体

单说文字直接生成视频这个方面,Make-A-Video 就战胜了不少专业的动画设计专业的学生。至少它什么风格都能做,而且制作成本非常低。

虽然官网还不能让你直接生成视频体验,但你可以先提交个人资料,之后 Make-A-Video 有任何动向都会先和你分享。

目前可以看到的案例不多,官网展示的案例在细节上还有一些怪异的地方。但不管怎么说,文字可以直接变视频,本身就是一个进步了。

一只泰迪熊在画自画像,你可以看到小熊的手在纸面阴影部分的投影不太自然。

天猫品牌消费者运营中心

荣耀x40 max发布会

机器人在时代广场跳舞。

猫拿着电视遥控器换台,猫咪手部爪子和人手极为相似,某些时候看还觉得有点惊悚。

还有戴着橙色针织帽的毛茸茸树懒在摆弄一台笔记本电脑,电脑屏幕的光映在它的眼睛里。

上面这些属于超现实风格,和现实更相似的案例则更容易穿帮。

Make-A-Video 展示的案例如果只是专注局部表现都不错,例如艺术家在画布上画画的特写,马喝水,在珊瑚礁游泳的小鱼。

realme笔记本发布

但是稍微写实一点的年轻夫妇在大雨中行走就很怪异,上半身还好,下半身的脚忽隐忽现,有时还会被拉长,如同鬼片。

还有一些绘画风格的视频,宇宙飞船登陆火星,穿着晚礼服的夫妇被困在倾盆大雨中,阳光洒在桌上,会动的熊猫玩偶。从细节上看,这些视频都不够完美,但仅仅从 AI 文字转视频的创新效果来看,还是让人惊叹的。

静态的油画也可以在 Make-A-Video 帮助下动起来——船在大浪中前进。

海龟在海中游动,最初的画面非常自然,后面变得更像绿幕抠图,不自然。

瑜伽训练者在朝阳中舒展身体,瑜伽垫也会随着视频的变化一起变化——这个 AI 就战胜不了学习影视制作的学生了,控制变量没做好。

最后输入一个视频模仿其风格创造视频变体也有 3 种案例。

其中一个变化相对来说没那么精致。宇航员在太空中飘舞的视频变为了美感稍弱版本的 4 个粗放版视频。

小熊跳舞的视频倒是有不少令人惊喜的变化,至少舞姿有变化了。

至于最后兔子吃草的视频就是最「安能辨我是雌雄」的类型了,5 个视频最后很难认出谁是初始视频,看着都蛮和谐。

文字转图片刚有进展,视频就来了

在《阿法狗之后,它再次彻底颠覆人类认知》中,我们曾经介绍过图像生成应用 DALL·E。曾有人用它制作出的图像去和人类艺术家 PK并最终取胜。

现在我们看到的 Make-A-Video 可以说是一个视频版本的 DALL·E(初级版)——它就像 18 个月前的 DALL·E,有巨大突破,但现在的效果不一定能让人满意。

DALL·E 创作的延伸画作

甚至可以说,它就是站在巨人 DALL·E 肩膀上做出成就的产品。相较于文字生成图片,Make-A-Video 并没有在后端进行太多全新变革。

研究人员在论文中也表示:「我们看到描述文本生成图片的模型在生成短视频方面也惊人地有效。」

描述文本生成图片的获奖作品

目前 Make-A-Video 制作的视频有 3 个优点:

1.

加速了 T2V 模型(文字转视频)的训练

2.

不需要成对的文本转视频数据

3.

转化的视频继承了原有图像/视频的风格

这些图像当然有缺点,前面提到的不自然都是真实存在的。而且它们不像这个年代诞生的视频,画质模糊,动作僵硬,不支持声音匹配,一段视频长度不超过 5 秒,解析度 64 x 64px 都是硬伤,它们的清晰度远远不够。

这个视频狗狗舌头和手有几帧非常怪异

几个月前清华大学和智源研究院(BAAI)研究团队发布的第一个能根据文本直接合成视频的 CogVideo 模型也有这样的问题。它基于大规模预训练的 Transformer 架构,提出了一种多帧率分层训练策略,可以高效的对齐文本和视频片段,只是也经不起细看。

但谁能说 18 个月后,Make-A-Video 和 CogVideo 制作的视频不会比大部分人更好呢?

CogVideo 生成的视频——这个目前仅支持中文生成

目前已经发布的文字转视频工具虽然不多,但在路上的却有不少。在 Make-A-Video 发布后,初创企业 StabilityAI 的开发者就公开表示:「我们的(文字转视频应用)会更快更好,适用于更多人。」

有竞争才会更好,越来越逼真的文字转图像功能就是最好的证明。


返回网站首页

本文评论
Facebook探索语音聊天功能 正测试音频频道_facebook可以语音吗
  Facebook 透露,他们正在为群组试验一项新的音频功能,让用户可以在群组中使用语音聊天。OPPO马里亚纳芯片  据悉,新的音频频道为用户提供专门的空间,让小组成员可以在任何...
日期:01-11
马斯克收购推特第一件大事,是把那个男人请回来?「马斯克新推特」
许多人都被一张叫“川普祝贺马斯克收购推特”的声明刷屏了。这是从外网传起的截图,一路火到了中文朋友圈。内容写着,“川普表示,他将于下周一重返推特”。很多国外名人也纷纷转...
日期:11-04
微软 Edge 浏览器 Dev 109 发布:改进侧边栏、WebView2、IE 模式等「新版edge浏览器兼容性站点」
  11 月 9 日消息,微软面向 Edge Dev 频道发布了新的功能更新,版本升级到 109.0.1481.0,带来了包括 Internet Explorer 模式的新开关,在新标签中打开侧边栏游戏的选项,以及 We...
日期:11-13
台湾为什么造不好电动车?_台湾人为什么不骑电动车
7年前,马斯克为了炫耀自家工厂,略带几分不屑地踩了一脚富士康:“相比手机,汽车工业非常复杂,你总不能去找富士康这样的供应商,告诉他‘给我造辆车’。”马斯克怎么也没想到,自己的...
日期:11-03
和环保少女互怼的网红涉嫌贩卖人口被捕 疑因其嘲讽视频泄露关键信息
(观察者网讯)万万没想到,环保少女通贝里和极右翼网红安德鲁·泰特打嘴仗这事儿竟然出现了“神展开”。泰特前脚拍视频回怼通贝里是“母体矩阵的奴隶”,后脚就因为涉嫌贩卖人口被...
日期:12-31
棉花被和羊毛被_棉花被羽绒被羊毛被…什么被子最能温暖寒冬中的我?
渐渐入冬的夜晚,躺在床上,一句古诗弹幕般浮现在脑海里:布衾多年冷似铁,娇儿恶卧踏里裂。保暖的被子太重要了。问题是:你知道什么样的被子最保暖吗?在讲被子之前,有必要先说说保暖。...
日期:11-26
仓储会员店下半场:抢人、抢货、抢商圈
作者|胡描 编辑|罗丽娟保持了30多年持续稳定增长的Costco,在线下零售行业萎靡的2022年,依旧交出了一份不错的成绩单。在9月22日美股盘后,Costco公布了2022财年第四季度及全年财...
日期:09-27
理想汽车没了1600亿 蒸发掉一个起亚
本文字数:2561|预计7分钟读完光环褪色。记者丨杨松编辑丨鄢子为一加10月发布会三个月时间,理想汽车港股股价跌了一半,市值蒸发1570亿港元,相当于跌去一个起亚。四家上市的新造车...
日期:10-12
时代红利 这次降临在为企业出海“架桥者”身上
文 | 互联网江湖如今互联网一个显著的趋势是:送水人正迈向全球发展,从送水人转变为企业出海“架桥者”的角色。广告,始终是互联网的第一商业模式。数字化智能营销,也就是做好互...
日期:08-24
百度地图“自动驾驶级”导航上线_百度地图驾车导航一公里
  8月12日消息,今日,@百度 官微宣布,百度地图X Apollo“自动驾驶级导航”体验全球首发,在北京市高级别自动驾驶示范区发布全新版本。戴尔xps15r  据了解,基于Apollo自动驾驶...
日期:08-14
业绩增长乏力 椰树集团“黑红”营销能走多远?「椰树集团战略分析」
原标题:业绩增长乏力,难以摆脱“大单品”依赖,椰树集团“黑红”营销能走多远?椰树集团产品华为mate20x刚上市价格日前,椰树集团在直播间里延续了其“土味”营销风格,直播内容除了...
日期:10-11
春晚 网络春晚_互联网找到了新春晚?
距离阿根廷世界杯夺冠已经过去数天,梅西夺冠相关词条仍旧挂在各大内容平台的热搜前列。虽然赛场上并没有中国球员的身影,但梅西圆梦、球王加冕,这届世界杯在国内的热度堪比一年...
日期:12-23
零跑的启示,中国电动车要谈生死了「电动车 零跑」
衣公子的剑——做爱读的商业评论2019年4月,上海青浦,交警拦下了一辆车。这是造车新势力零跑,邀请媒体试驾新车。交警说,临牌是假的。车辆被当场扣押,最倒霉的是正在开车的这位媒...
日期:10-10
马斯克把公开给他纠错的工程师开除了_马斯克是工程师
“He’s”fired.”马斯克的裁员大戏还在继续,而最新的这“一集”,矛头直指一名在推特待了6年的工程师。甚至The Verge都这样描述:虽然马斯克已经开除了数千人,但最新的人事变动...
日期:11-18
美国公布520亿美元芯片提案_美国“芯片法案”的未来走向,是否被格芯与IBM提前剧透?
当拜登签署涉及价值2800亿美元的《芯片和科学法案》之时,外界普遍判断,英特尔将是这块蛋糕的最大分食者之一。从目前的公开报道来看,“法案”落地之后,该企业也是美国各芯片厂商...
日期:09-22
自动驾驶新宠地平线,是大众破局中国关键?_地平线 智能驾驶
老牌企业如何走入新时代的故事总是让人万分期待,更何况发生在汽车行业的种种变化。有人认为新玩家将会取而代之成为新一代的主宰,也有人认为庞大的帝国能够驶过时代沟壑,在全新...
日期:10-19
豆瓣9.0 这部年度科幻神作值得《三体》们学习「打败三体的科幻作品」
任天堂超级马里奥第一代意识传云端在售的诺基亚手机烧脑硬科幻今天你可能错过的大新闻...
日期:11-04
小家电正在经历寒冬 坏消息是未见春天
2022是疫情三年里最艰难的一年,同时也是拨开云雾见青天的一年。这一年里,很多人经历了时长最久的封控,对工作生活以及经济收入造成巨大影响。大家赚不到钱,自然也就没有消费的欲...
日期:12-22
雷军赌上一切的战争是哪一集_雷军赌上一切的战争
文|《中国企业家》记者 赵东山编辑|李薇头图摄影|史小兵“回首过去3年,高端化战略深刻影响着小米,并深度改变了小米。”12月11日,小米集团创始人、董事长兼CEO雷军在小米最新发布...
日期:12-22
中国首款肉鸡基因组育种芯片“京芯一号”诞生记
在我国肉鸡育种领域,SNP芯片研发与新品种选育交织并进,国内首款自主研发的肉鸡基因组育种芯片“京芯一号”一经应用,就打破了国外垄断,推动国内首批自主培育白羽肉鸡品种之一“...
日期:10-21