您的位置:首页 > 互联网

AI视频「闪烁」难题攻破!轻松改变视频风格,北大校友一作_ai怎么做闪光

发布时间:2023-06-15 20:25:40  来源:互联网     背景:

声明:本文来自于微信公众号 量子位(ID:QbitAI),作者:萧箫,授权转载发布。

AI拍视频,竟然已经丝滑到这个程度了吗?

输入一段视频,念上一段“咒语”,AI瞬间就能秒懂,并当场给你把视频重画一遍:

国际铁路标准体系

ai怎么做闪光效果

不仅完美hold住各类风格,最关键的是,帧帧丝滑流畅。

就连建筑物这种细节较多的视频,也几乎看不出“AI出品”的bug:

目前,无论是拍视频还是制作动画,依靠的都是“关键帧”。如果帧与帧之间联系不紧密,就会出现这种诡异的“闪烁画风”——

而这也是AI生成视频最大的瓶颈之一。

现在,来自南洋理工大学的团队,终于解决了这个问题,研究在推特上掀起了不小热度:

那么,这究竟是如何做到的?

如何让AI拍的视频不“闪烁”?

AI生成视频会“闪烁”,本质上是前后帧不连贯导致的。

举个例子,这是同一个视频中截取的两帧画面:

用AI根据这两帧“重绘”图像,乍一看问题不大,细节上却有不少差异。

例如,一帧生成的人物头上有“金色发带”,另一帧中却消失了:

这样一来,看似AI生成的几十帧图像风格差不多,连起来细节差异却非常大,视频也就容易出现闪烁现象:

为此,研究人员提出了一种新框架,,核心是提升AI生成视频时帧与帧之间的连贯性。

这个框架包含关键帧翻译(key frame translation)和完整视频翻译(full video translation)两部分。

第一部分基于扩散模型生成关键帧,基于跨帧约束加强这些关键帧之间的一致性;第二部分则通过基于时间感知的匹配算法将其他帧与关键帧“连接”起来。

框架的核心,在于第一部分。

研究人员给这部分提出了一种新的分层跨帧一致性约束方法,在原视频基础上,利用光流来约束帧与帧之间的关系。

其中,第一帧相当于整个视频的“锚点”,用于控制视频的整体走向;后续的每一帧,则都会以前一帧作为参考,防止生成的图像偏离最初的风格、形状、纹理和颜色等。

至于视频生成模型,核心采用的则是Stable Diffusion+ControlNet的组合,但经过了改进。

如下图所示,红色虚线是原本Stable Diffusion等扩散模型采样过程,黑色线条则是经过调整后的过程:

当然,在不同的采样阶段,跨帧约束也不一样,包括形状感知、像素感知等。

相比之前的AI视频生成模型,这个框架最大的优势在于,当输入一个新视频的时候,它不需要再用这个视频材料重新进行训练,换而言之就是零样本学习。

快手 q2财报

只需要输入一段提示词+一段视频,框架就能自动将视频“翻译”出你想要的效果。

例如,这是团队利用改进后的框架,重新生成的一段相同风格视频,和改进前的扩散模型相比,几乎看不出闪烁了:

14秒生成一张关键帧

所以,生成一段视频是否需要很长时间?

至少从生成帧的效率来看,速度还是不慢的,其中关键帧和Stable Diffusion出图的速度差不多,平均在14.23秒左右;非关键帧就非常快了,每帧只需要1.49秒。

如果视频不长、甚至只有十几帧的话,不到一分钟就能搞定一段视频的转换。

作者们将这个新框架和之前的几类文生视频框架进行了对比,包括FateZero、vid2vid-zero、Pxi2Video和Text2Video-Zero等,显然新框架目前是最流畅、鬼影也最少的:

不仅仅是单纯的“视频翻译”,作者们还展示了提示词对于视频生成的控制效果。

例如在相同输入下,只要更改一段提示词中的“关键字”,AI就能在几乎不改动其他元素的情况下,生成一段新的视频,例如换个发型、换种风格,或是将狗头换成狐狸头:

除此之外,作者们还请来了23名志愿者,对新框架生成的视频质量进行了综合评分,评估指标有三个,分别是提示词和输入帧的关联度、时间一致性和视频整体质量。

结果显示,这个框架在“人类评分”中均取得了不错的水平:

一作北大校友

四位作者均来自南洋理工大学。

一作杨帅,南洋理工大学助理教授,本科和博士毕业于北京大学,目前的研究方向是基于人像的编辑、文本风格化、图像翻译等。

周弈帆,南洋理工大学研究工程师,本科毕业于北京理工大学,拿过ACM-ICPC金牌,研究方向包括文本挖掘、基于机器学习重建入射光场等。

刘子纬,南洋理工大学助理教授,香港中文大学博士,研究方向是计算机视觉、机器学习和计算机图形学等。

Chen Change Loy,南洋理工大学和香港中文大学副教授,他的研究兴趣集中在计算机视觉和深度学习方向,包括图像、视频恢复和生成,以及表征学习等。

目前这个项目的代码还没开源,不过论文表示“会有的”。

intel的酷睿现在到第几代了

真我手机应用锁密码忘了怎么办

实测效果如何,我们可以期待一波。

项目地址:

https://anonymous-31415926.github.io/

论文地址:

https://arxiv.org/abs/2306.07954


返回网站首页

本文评论
iPhone 14 Plus明天首销 6999起 没发售就破发「苹果14最新消息」
明天,也就是10月7日,iPhone 14 Plus将正式首销,该机有着6.7英寸的大屏,首发售价为6999元起,首批参与iPhone 14 Plus预订的用户,今明两天就会收到快递信息,明天上午就能拿到手机了。...
日期:10-18
戴尔外星人笔记本_戴尔外星人笔记本怎么样质量
戴尔外星人(Alienware)是一款高端的游戏PC品牌,以其不同寻常的外观、产生强烈的视觉冲击力的不温不火的灯光、高性能硬件和强大的游戏性能而闻名。Alienware于1996年成立于美国...
日期:05-30
苹果 Apple Watch 手表 watchOS 9“房颤历史”即将登陆香港地区
来源:中关村在线IT技术信息 9 月 13 日消息,苹果今日推送了 watchOS 9 正式版更新,带来了多项体验改进。房颤历史(AFib History )是苹果 Apple Watch 手表系统 watchOS 9 的最新...
日期:09-13
淘宝线下代购点遍布厦门(厦门代买东西)
今天上午,厦门市60余家淘宝网社区代购网点在正式开业,这些遍布在社区附近的淘宝代购店将为广大非网购人群提供优质淘宝商品代购服务,让更多消费者在自己家门口,无需上网就可以...
日期:07-22
比亚迪新款纯电suv「海外市场再下一城!比亚迪宣布进入印度:运动型纯电SUV发布」
比亚迪海外市场再下一城。vivo手机最新款x80今日,比亚迪官方表示,10月11日,比亚迪在印度新德里召开品牌发布会,宣布正式进入印度乘用车市场,并发布了第一款高端纯电SUV元PLUS,这也...
日期:10-15
爱奇艺正式起诉「爱奇艺回应被起诉限制投屏:已收到应诉通知」
2月1日 消息:就在刚刚,爱奇艺发文称,已收到关于投屏清晰度变更的应诉通知,一定会本着尊重法律、尊重合同、尊重消费者权益的原则认真审慎对待。锤子 坚果Pro 2S就在不久前,爱奇...
日期:02-01
消息称百度将在中国推出类似ChatGPT的人工智能工具
1 月 30 日讯:据彭博报道,消息称百度将于 3 月在中国推出类似ChatGPT的人工智能工具。支付宝中秋节付款码皮肤分享...
日期:01-30
华为高管:千万不要给折叠屏贴保护膜 影响使用寿命
快科技5月13日消息,现在大部分厂商都会给自己的手机出厂就贴好保护膜,从而保护屏幕,直屏手机尚且如此,折叠机就不好说了。相信大多数人买到折叠屏手机撕膜是为了贴上更好的保护...
日期:05-13
微信广告推出“小程序流量主代运营”功能 助力商家流量变现_小程序流量主广告位
1月11日 消息:微信宣布,微信广告联合微信开放平台,推出“小程序流量主代运营”模式,通过为服务商(即“小程序代开发服务商”)提供官方产品能力,支持其协助小程序商家进行流量变现,...
日期:01-11
达达集团蒯佳祺荣休,何辉剑接棒总裁,京东零售辛利军任董事会主席
  王一鸣;    8月23日早间,本地即时零售和即时配送平台达达集团(NASDAQ:DADA)发布了截至2022年6月30日未经审计的2022财年第二季度业绩。达达集团2022年第二季度总营收为2...
日期:08-24
拼多多为啥不在国内上市「外媒:拼多多搁置赴港上市计划」
12月29日消息,科技媒体The Information周三援引知情人士的话报道称,包括拼多多和满帮在内的多家在美上市中国科技公司已搁置或取消有关在香港上市的谈判。在这份报告发布之前,...
日期:12-29
CITE2023精彩演讲回顾:存算一体超异构为中国AI大算力芯片注入新动能「存算一体存储技术」
4月7-9日,以 “创新引领 协同发展” 为主题,由工业和信息化部与深圳市人民政府联手打造的第十一届中国电子信息博览会(CITE2023)在深圳隆重举行。亿铸科技在主题演讲、圆桌论坛...
日期:04-13
元宇宙社交新生态,虚拟KTV背后是谁?_元宇宙虚拟主播
随着元宇宙概念的落地和发展,虚拟宇宙社交形态正在经历飞速演变:3D场景KTV、虚拟广场、精细化捏脸等玩法层出不穷。国内外互联网大厂如Meta、字节、百度等都持续在元宇宙社交...
日期:08-03
苹果13不香还是等14吧「二手iPhone 14贬值严重 还是“十三香”!」
中关村在线消息:由于iPhone 14、iPhone 14 Plus两款机型由于销量不理想,可能会减少设备零部件的订购。有面板产业链相关人士曝光称目前iPhone 14的面板订单相比iPhone 13已经...
日期:10-17
homepod会出二代吗「为何停产初代后又推HomePod 2?苹果称消费者更喜欢大型扬声器」
IT之家 2 月 3 日消息,苹果于 2021 年 3 月宣布停产初代 HomePod,并表示其开发重心会放在成本较低的 HomePod mini 上。但时隔将近两年,苹果的第二代 HomePod 今日发售,国内售价...
日期:02-03
直播带货爆火 机构双11抢主播:时薪千元招不到人「直播带货爆款」
近几年,电商直播飞速发展,直播带货成了大大小小商家新的营销方式,随着双11预售的开启,带货主播也成了香饽饽,但即使时薪涨至千元,薪资涨5倍,双11仍然一播”难求。三星a5相机微众银...
日期:10-29
每日优鲜盘前暴涨是“回光返照”?知情人士:仅有几个总经办人员留守
21世纪经济报道记者雷晨 实习生邹梦阳、黎雨辰 北京报道   当地时间8月4日,每日优鲜(MF)美股盘前快速拉升,涨幅一度逾160%。此后,其涨幅在一小时内逐渐收至120%左右。公开数据...
日期:08-06
左中右微公交荣获2019中国新经济创新势力榜“最具成长力出行平台”大奖
  3月12日,由 iiMedia Research(艾媒咨询)主办的2019出行超级沙龙在北京圆满落幕,同期举行“2019中国新经济创新势力榜”颁奖盛典,作为优秀企业代表,左中右微公交荣获“2019...
日期:04-22
授权门店自曝:卖一台iPhone新机仅挣100元 安卓只有三四十块「授权店卖一台苹果手机利润」
快科技4月24日讯,迄今为止,苹果在中国大陆总共开了45家Apple Store零售店,也就是直营店。显然,这意味着更多人买手机、平板等需要从网上下单或者通过授权店入手。一个有趣的数据...
日期:04-25
小米MIX2S价格跌破2K,真全面屏:很香(小米mix2s现在价格)
  华为和小米都是目前国产智能手机中非常优秀的品牌,但是它们却有着完全不一样的品牌调性。华为通过Mate系列和P系列成功的拿下了高端市场,小米原本也有一个非常高端的系列...
日期:02-02