您的位置:首页 > 互联网

后期狂喜!一张照片丝滑替换视频主角,动作幅度再大也OK|Meta&新加坡国立大学

发布时间:2023-12-08 00:32:14  来源:互联网     背景:

声明:本文来自于微信公众号 量子位 (ID:QbitAI),作者:丰色 ,授权转载发布。

在忙生活也要有仪式感

后期狂喜了家人们~

现在,只需一张图片就能替换视频主角,效果还是如此的丝滑!

且看这个叫做“VideoSwap”的新视频编辑模型——

小猫一键变小狗,基操~

如果原物体本身扭动幅度大一些?也完全没问题:

细看俩者之间的运动轨迹,给你保持得是一毛一样:

再如果,替换前后的物体形状差别较大呢?

例如车身较高的SUV换更长的超跑,大邮轮换小白船。

呐,也是一整个完美替换,基本看不出任何破绽:

对比谷歌今年2月发的同类视频替换模型Dreamix:

三体创始人

不得不说,现在这技术进步真是肉眼可见啊~

那么,它是如何做到的呢?

未使用的新iphone屏幕有划痕

方法也很有意思。

只需几个语义点,拽一拽就OK

不管是风格转换还是主题/背景转换,这种视频编辑任务的主要挑战都是如何从源视频中提取运动轨迹传输到新视频、覆盖到新元素上,同时确保时间一致性。

此前的模型(原理包括编码源运动、使用注意力图、光流等)大多数顾此失彼,要么在时间一致性上做的不好,要么会严格限制形状变化。

在此,VideoSwap提出使用少量语义点来描述物体的运动轨迹。

如下图所示,飞机的运动轨迹就可以通过机翼、机头和机尾的4个点来表示。

而在替换成直升机时,我们可以删除两个点,在只保留机头和机尾来对齐运动轨迹的同时,免除形状约束,让体型不一样的直升机得以替换。

除了删除语义点,它还能拖拽。

像开头展示的这个SUV变超跑,由于车身变长了,我们不对语义点进行处理,超跑就变形了:

对此,我们只要将SUV车头和车尾的几个点稍加挪动就OK:

下面这个天鹅的替换视频也是经过了语义点拖拽:

那么具体来说,VideoSwap是如何操作的呢?

从它的pipeline来看,简单来说,VideoSwap也是基于扩散模型(潜扩散)。

它首先用VAE编码器对源视频进行编码,获得潜空间表示;然后用DDIM反演将它变换回有噪声的表示。

接着用文本提示中的源主题(例如猫)替换目标主题(狗),并使用DDIM scheduler进行去噪。

在这个去噪过程中,就可以引入语义点对应关系来引导目标主题遵循原来的运动轨迹进行生成了。

最后,为了保留背景,作者在此还采用了一个潜混合的概念。

此外,他们还通过将视频运动层集成图像扩散模型中,来确保结果的时间一致性。

这里的关键点之一就是VideoSwap中的语义点提取和注册(register)pipeline。(“注册”是指把语义点安插到源视频)

首先它需要我们在关键帧中标出关键语义点,然后再从视频中提取所标语义点对应轨迹的embedding。

接下来在语义点匹配中,embedding由多个2层可学习MLP投射,并根据其坐标位置放置到空特征中,然后逐元素添加到扩散模型中作为运动引导。

至于用户拖动语义点后还可以让视频保持很好的一致性,这里用到的技术则是基于分层神经图谱(LNA)的点位移传播。

通过被训练过的LNA,用户拖动产生的位移就能通过它的规范空间一致地传播到每一帧之中。

最后,作者表示:基于以上这些方法,VideoSwap通过大量测试,最终取得了SOTA成绩,成为目前最好的视频变换模型。

这是它和一些主流方法的效果对比:

目标是把飞机变直升机。

可以看到,除了VideoSwap,绝大多数方法都只在机头部分往直升机的方向靠拢,不细看都发现不了,并且有的还伴随着明显的闪烁和伪影。

作者介绍

VideoSwap由新加坡国立大学和Meta合作完成。

一作Yuchao Gu为新加坡国立大学博士生,此前硕士毕业于南开大学,他的研究方向正是AIGC,尤其为视频生成为主。

他同时也是Meta GenAI方向的实习生。

通讯作者为新加坡国立大学助理教授Mike Z. Shou,他此前是Facebook AI的研究员。

参考链接:

https://arxiv.org/abs/2312.02087

https://videoswap.github.io/

—完—


返回网站首页

本文评论
小米civi值得买吗 知乎「米粉买小米Civi 3迪士尼限定版 太好看了」
近日小米上架了小米Civi 3迪士尼限定版,而近日一位米粉购入后惊呼”太好看了“。该机最大的亮点在于背部,迪士尼的经典角色米奇与小米Civi 3完美融合,米奇单手指向手机的主摄,就...
日期:06-11
苹果将允许约会应用程序在荷兰提供第三方支付选项
  北京时间1月16日上午消息 据媒体报道,根据荷兰监管机构的裁决,苹果需要允许约会应用程序开发商为荷兰用户提供其他支付方式选择。此举将免除荷兰的约会应用程序在程序内...
日期:02-04
变革新生,朱兴良带领金螳螂实现业绩逆势增长(金螳螂 业绩)
  2020年初突如其来的疫情,使得装修行业收到冲击,在这种危机下,朱兴良带领金螳螂在危机中寻找机遇,变革意味着新生,凭借着朱兴良对装修行业的匠心以及金螳螂的自身综合实力,企...
日期:10-11
华为Mate 50迎来大版本更新:增强性能 升级包1个G_华为mate20升级版
华为Mate 50系列已经发售了两个月,而目前终于迎来了首次大版本更新,现在推送包有接近1GB大小。谷歌收购twitter三星手机不错更新日志显示,本版本优化了整机系统性能和稳定性,并...
日期:11-18
神舟十二号载人飞船返回舱成功着陆感悟「返回舱成功着陆!神舟十四号载人飞行任务取得圆满成功」
(原标题:返回舱成功着陆!神舟十四号载人飞行任务取得圆满成功) 神舟十四号载人飞船返回舱成功着陆 ...
日期:12-05
大模型创业:避开巨头锋芒,搞钱才是要紧事_做大模型用什么材料最好
声明:本文来自于微信公众号 Tech星球(ID:tech618),作者:任雪芸,授权转载发布。去年末,搜狗原CEO王小川只是体验了几次ChatGPT ,就确信 “AGI已经来了”。后来在创业者社区的一次线...
日期:11-24
谷东科技AR眼镜的光学显示原理和工艺分享_谷歌AR眼镜
  1、AR眼镜中的光学显示方案   增强现实技术即AR技术是在展示真实场景的同时,通过图像、视频、3D模型等技术为用户提供虚拟信息,实现将虚拟信息与现实世界巧妙地相互...
日期:07-14
三星手机电池极易鼓包引发老外集体吐槽:别的牌子很少见到「三星手机电池鼓包了还能用吗」
来自英国的Up主Mrwhosetheboss没想到,自己的运气会这么差。日前,在发现手头的Galaxy Note 8出现电池鼓包问题后,他决定买一部新手机。可屋漏偏逢连夜雨”,就在这时候,去翻找备用...
日期:10-01
不用加价买了!赵明:荣耀Magic V2 8月1日前已付款订单将于24日前全部发货
快科技8月17日消息,自7月20日首销以来,荣耀Magic V2已经上市近一个月。不少想入手的网友遇到最大的问题是,一直缺货排队怎么办?今日,荣耀终端有限公司CEO赵明在微博上表示,荣耀Ma...
日期:08-17
索尼推出 Playstation Star 服务 为玩家提供数字藏品_playstationhome
DoNews9月29日消息(郭睿琦)索尼今天宣布, Playstation Star 服务现已正式上线,玩家可通过该服务获得数字藏品以及积分等奖励。电信运营商面临的挑战PlayStation Plus 会员同时加...
日期:10-01
MEET峰会Doug Dohring:激励式学习让中国孩子像说母语一样说地道英语
  12月4日,由腾讯教育主办的首届MEET教育科技创新峰会在北京圆满举行。来自国内外的顶尖教育专家,共同探讨了智能时代背景下,科技如何助力教育的未来发展。   全球知名教...
日期:03-08
太二酸菜鱼大众点评优惠券「太二酸菜鱼回应遭大众点评下架 正与平台方积极沟通」
在大众点评上搜索不到太二酸菜鱼的信息,引起了人们的注意。太二酸菜鱼的母公司九毛九集团的公关负责人对此进行了回应。他在接受媒体采访时说,他们正在对这件事进行调查,而且太...
日期:10-27
第三季度全球十大IC设计公司营收排名:博通第一,高通第二_中国IC设计行业30家上市公司综合实力排名
  12月4日消息 根据集邦咨询旗下拓墣产业研究院最新调查,全球前十大IC设计厂商最新营收排名现已出炉,博通第一,高通第二,英伟达第三。   据介绍,由于华为手机搭载自家处理...
日期:02-03
星纪魅族集团与极星成立合资公司 “双星”合璧
6月19日,致力于消费电子与智能出行深度融合的星纪魅族集团与全球豪华纯电高性能汽车品牌Polestar极星在上海举行战略合作签约仪式,正式宣布设立全新的合资公司。智能融合时代,...
日期:09-23
1688的活动「1688推出“春节不打烊 服务1元购”活动」
1月17日 消息:2023年春节就要来了,1688推出“春节不休息,服务一元购”活动,提供工具必备攻略,协助商家备战春节。对于春节期间处理订单发货需求,1688推荐选用服务市场中的“订单...
日期:01-18
WinPhone7应用已超1万 增速超苹果Android(Windowsphone7)
  3月15日消息,据国外媒体报道,自从微软在去年秋季推出Windows Phone 7操作系统以来,该款操作系统便赢得了许多粉丝,现在由这款操作系统所支持的一系列手机又拥有了更多软件...
日期:07-26
浅谈闲侣在元宇宙虚拟空间的探索
2021 年被行业内认为是元宇宙元年,但目前对于元宇宙的定义并没有一个统一的标准。一千个人眼中有一千个对元宇宙的理解,有的人认为元宇宙是一个与现实世界完全切断联系的空间;...
日期:08-17
下沉网红,好看不好赚?_下沉一些
声明:本文来自于微信公众号 刺猬公社(ID:ciweigongshe),作者: 陈首丞,授权转载发布。最近,一批地域网红用方言“说唱”席卷着抖音用户的信息流。地图的北端,山西的四个主持人,在一...
日期:08-07
网上商城2010年全行业融资达10亿美元_互联网商城有限公司
  进入冲刺期,今年全行业融资已达10亿美元,根据易观咨询最新发布的数据,再加上京东商城上周刚刚公布的融资额,仅仅在今年,我国电子商务行业融资已达到10亿美元,这是一个正在疯...
日期:07-25
裁员超5500人、净利润腰斩,腾讯怎么了?(今年裁员为什么这么多)
查看最新行情   来源:极客公园   作者/连冉   编辑/郑玄   不出预料,腾讯二季度交出了一份糟糕的成绩单。   8月17日晚间,腾讯控股发布2022年第...
日期:08-19