您的位置:首页 > 互联网

因为它,马斯克和兵马俑跳起了《科目三》

发布时间:2024-01-06 15:14:18  来源:互联网     背景:

一张照片就能让马斯克、梅西等各大名人魔性跳舞,甚至连火爆全网的科目三都能安排上。

这可不是什么高深 AI 技术,阿里通义千问移动端新增的全民舞王功能就能实现,还有科目三、DJ 慢摇、鬼步舞、极乐劲舞等 12 种热门舞蹈模版供你挑选。

在通义千问输入全民舞王通义舞王等口令,接着在跳转界面里选择你喜欢的舞蹈、上传一张全身照,只需十几分钟,一个形神兼备的舞王就这样华丽速成了。

想不到,浓眉大眼的爱因斯坦也能秒变潮男,动作节奏感简直不要太强。

▲ 图片来自:Simon_阿文

兵马俑和舞王只差了一张照片,这架势可不是盖的。

手办届的舞王称霸,怎么能忽视我亚洲舞王尼古拉斯赵四呢?

▲ 图片来自:共富财经

随手一画的小人物都跳得比我还欢,看来我得去报个舞蹈班才行。

▲ 图片来自:叨哥胡侃

蜡笔小新搔首弄姿,童年瞬间回来了。

vivo模仿三星

▲ 图片来自:盼花 dog

让照片活起来的 AI 魔法

那阿里的 AI 研究团队是怎么让照片动起来的呢?

通义舞王功能的发布,实际上是 AnimateAnyone 技术的一个具体应用和落地。

据阿里 AI 研究团队发布的论文介绍,目前,扩散模型是视觉生成研究领域的主流,但在图像到视频的生成领域中,依然存在局部失真、细节模糊、帧率抖动等问题。

对此,阿里的 AI 研究团队在扩散模型的基础上,提出了一种新的 AI 算法 Animate Anyone。这个算法的功能是将一个静态的人物图像转换成一个动画视频,同时可以通过输入姿势的顺序来精确控制视频中的人物动作。

▲手翻书原理展示. 图片来自:@翻页书安迪 Andymation

需要说明的是,在视频制作特别是动漫制作中,人物的动作是通过逐帧过渡完成的,原理类似于小时候经常玩的手翻书,每一页都是静态的手绘稿,快速翻动就能通过人眼视觉暂留的 BUG 让画面动起来。

而想要让一张图片动起来,最大的难点来自脑补接下来的动作和场景,并且前后都没有参照物。所以官方的对比展示中,可以看到传统技术DisCO被作为反面教材反复鞭打,其严重的失真效果只能做到让主体动起来,但扭曲的身型和奇怪的动效完全称不上作品。

因此,为了解决视频人物形象一致性的问题,他们引入了参考图像网络 ReferenceNet,它可以捕获参考图像中的空间细节信息。

然后,他们将 ReferenceNet 与 UNet 结合,让 UNet 可以理解在生成目标图像时应该在哪些位置生成怎样的细节,这样就可以使生成的图像在整体上去除噪音的同时,保留参考图像中的关键细节,实现人物形象的一致性。

除了细节的捕捉以外,还要确保姿态的可控性。为此,阿里 AI 团队还设计了一种轻量级的姿态引导器 Pose Guider,在去噪过程中集成姿态控制信号,以确保生成的动画序列符合指定的姿态。

考虑到视频的稳定性问题,他们还引入了时序生成模块,目的是让模型可以学习帧与帧之间的联系,这样生成的视频才会流畅连贯,而不是割裂开来,同时还可以保持高分辨率细节,让画质变得更好更稳定。

比起以前的方法,该方法能够有效保持了视频人物外观的一致性,不会出现诸如衣服颜色变来变去等问题,同时视频流畅清晰,不会闪烁抖动,并且还支持对任意角色进行动态化。

例如,梅西玩转中老年最爱的顶流范儿,和你抬手打招呼。

二次元角色以静化动,跳起宅舞来丝毫不逊色真人。

连钢铁侠都加入热闹,一起强身健体,活动活动筋骨,也没啥毛病。

在 AI 视频生成领域,阿里背后的技术积累远不止这些,比如上个月,阿里还发布了另一项视频生成技术 DreaMoving。这是一种基于扩散的可控视频生成框架,用于生成高质量的定制化人像视频。

这项技术的优势在于,无需深入了解复杂的视频制作技术,使用者只需给定一些引导,比如一段文字或一张参考图像,DreaMoving 就能够创造出高度逼真的视频。

也就是说,只要给定目标身份和姿势序列,DreaMoving 可以根据姿势序列生成,任何人/物在任何地方跳舞的视频。

简单点理解,DreaMoving 可以通过简单的输入,比如人脸图片、动作序列和文本,就可以自动生成各种定制化的人物视频,实现对视频生成的精确控制。

具体的拆解步骤:先输入一个人的面部图片,来生成这个人的整个身体在视频中的形象,接着输入姿势的顺序,来精确控制人物在视频里的动作,最后输入文本来更全面地控制视频的生成效果。

例如,一个女孩,微笑着,站在海边的沙滩上,穿着浅黄色的长袖连衣裙。

一名男子在埃及金子塔前跳舞,身穿西装,打着蓝色领带。

一个女孩,穿着浅蓝色长裙,在法国小镇微笑着跳舞

AI 视频生成行业卷疯了

事实上,在生成式 AI 的赛道中,AI 视频生成领域的起点并不算太晚,在 ChatGPT 横空出世之前,就已经有不少厂商押注该赛道,诸如微软、Google 等都曾推出过类似的 AI 视频生成工具的,但效果甚微。

立足于整个行业长期的技术积累之上,扩散模型的出现让厂商们看到了 AI 视频生成的潜在前景。相比 RNN 等早期模型有明显优势,它可以生成更连贯、清晰的图像或视频序列,加速了视频生成的迭代过程。

市面上的主流工具也在此基础上大作加法,让 AI 视频生成赛道再起波澜,真正呈现出惊人的爆发之势。

印度bis认证最新要求

去年年底,Runway Gen-2 迎来一波大更新,分辨率提升至 4K,视频生成效果的保真度和一致性迎来重大突破,一周后,又再次推出运动画笔功能,轻轻一刷,便能让静态事物动起来。

紧接着,文生图的扛把子Stability AI 也发布 Stable Video Diffusion,给 AI 视频生成领域再添一把旺火。

而 Pika 1.0 则凭借更简单的视频生成,浅显易懂的视频局部编辑,更高质量的视频生成,刚出道便获得一众硅谷大佬的青睐。从生成到后期,仅靠自己就能完成一条龙操作。

李飞飞团队和 Google 合作推出的 W.A.L.T 模型,也同样可以根据自然语言/图片提示,生成逼真的 2D/3D 视频或动画,生成效果更是媲美 Runway、Pika 等一众好手。

这些 AI 视频生成工具主要在两个维度上有了长足进步——质量和数量。在质量上,这些 AI 产品不断引入更强大的模型架构,使用更大规模、更高质量的数据进行训练,使得 AI 生成的视频画质、流畅度、逼真度等都在持续提升。

在数量上,生成的视频长度也在不断内卷,朝着两位数的秒数长度突破,场景和事件组合也日益丰富。未来在算力进一步提升的情况下,生成长达数小时的高质量视频也将成为可能。

飘在云上的技术终究还是落地应用,AI 视频生成的崛起将会诞生一个巨大的蓝海市场。依托技术的深厚积累,通义千问的全民舞王的上新,也是基于这套商业逻辑的又一落地产物。

这不仅可以打开与阿里与其他企业的竞争,促使整个行业加速进步,也让我们有机会亲身体验更多 AI 视频生成技术所带来的种种可能。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

| · ·


返回网站首页

本文评论
5G发展四周年渐入中局,创新方得发展「2020年5g发展现状与未来趋势」
通信世界网消息(CWW)2019年6月6日,工业和信息化部正式发放了5G商用牌照,至今已历4年。4年来,我国电信运营商在5G网络部署、业务开展以及技术创新等方面取得了令人瞩目的成绩,5G移...
日期:06-07
猿辅导it部「猿辅导UI设计工具Motiff推出三大AI功能 正式开放试用申请」
近日,以“设计领导力”为主题的IXDC2023 国际体验设计大会在京开幕。作为“AI时代的设计工具”,看云控股研发的Motiff在大会期间正式发布AI布局、AI设计系统、AI魔法框等三大A...
日期:08-07
饿了么蓝骑士有保底工资吗「饿了么宣布蓝骑士保障重磅升级!免费读大学、还有万元重奖」
饿了么日前在蓝骑士仲夏夜活动上宣布了一系列升级举措,旨在进一步支持骑手工作,共同发展生态系统。airpods3代闪电充电盒与magsafe充电盒据了解,饿了么推出了名为"圆梦活动"的...
日期:07-13
最近很火的一个女海王「半年涨粉一千万,第一女海王怎么就火遍了全网?」
声明:本文来自于微信公众号 KOL使用手册(ID:KOL-TOPKLOUT),作者:雨过炊烟,授权转载发布。“帅哥,谈恋爱吗?”王七叶走在大街上,一如往常撩帅哥,谁曾想男主一下子被红绳捆走。为了解...
日期:11-02
iPhone 15 将升级 U2 芯片_ios15支持什么处理器
据知名分析师郭明錤透露,苹果即将推出的 iPhone 15 搭载升级版的超宽带(UWB)芯片,以优化与 Apple Vision Pro 空间计算设备的集成。电子烟政策落地郭明錤表示,升级 UWB(苹果目前称...
日期:06-22
梅西阿根廷队最新进球「梅西仅直播露面 阿根廷中国行主办方负责人致歉:第一次业余了」
6月15日消息,近日阿根廷国家队来到了中国,梅西率队将于澳大利亚进行一场友谊赛。vivo s10 pro支持光学防抖原本这是国内球迷追星梅西的好机会,但因为出现安保等各种问题,梅西等...
日期:06-15
小米iot生态链「小米iot生态版图目前全面向三方开放,小米CarIoT生态」
来源:中关村在线12月28日下午两点,小米汽车技术发布会正式开始。小米充电宝10000毫安推荐在保iphone使用期间屏幕有划痕小米智能驾驶,更聪明、更安全,来自全栈自研智能驾驶技术:...
日期:12-29
携程又要出招了「携程的春天来了吗?」
声明:文来自微信公众号“伯虎财经”(ID:bohuFN),作者:梦得,授权转载发布。2023年第一波报复性消费从春节旅游开始,夸张到什么地步?三亚酒店一晚价格最高达到20万年以上。德宏芒市...
日期:01-30
清洁工带孩子「清洁工花三个月工资给孩子买iPhone 14 Pro 店家:现在孩子怎么了」
月薪三千,你会给家人买接近万元的iPhone 14 Pro吗?据无限金华报道,4月20日,上海一家手机专卖店里,来了一位清洁工大叔和孩子一起来买手机。孩子要了一部iPhone 14 Pro,清洁工大叔...
日期:04-21
tiktok美区日区有什么区别「从接商单到纯佣合作,揭秘TikTok美区达人带货飞速增长之路」
声明:本文来自于微信公众号 亿邦动力(ID:iebrun),作者:缪悦,授权转载发布。正式开放不到3个月,TikTok电商在美国市场就已展现出不俗的增长潜力。多位业内人士向亿邦动力证实,目前T...
日期:11-30
极氪ZEEKR 001第5万辆下线 创造新势力品牌首年生产速度纪录「极氪zeekr官网到底是什么」
10月12日消息:极氪 ZEEKR 官方宣布,旗下豪华猎装轿跑 ZEEKR001的第5万辆正式下线,不到1年,创造了新势力品牌的首年生产速度纪录。索尼双摄手机据此前极氪公布的极氪001交付数据...
日期:10-25
女子2百多网购却被花呗扣款3千多?花呗深夜回应:确认是主动消费
8月9日消息,日前,一则女子2百多网购却被花呗扣款3千多”的引起热议,话题一度登上微博热搜第一。对此,花呗官方微博深夜0点上线对该消息进行回应,事件终于真相大白。官方表示,今晚...
日期:08-09
马斯克宣布重磅消息「马斯克将对推特全面裁员 已要求经理制定裁员名单」
凤凰网科技讯 北京时间10月30日消息,知情人士称,在完成了对推特的收购交易后,埃隆马斯克(Elon Musk)计划最快从当地时间周六开始对推特裁员,目前已经要求一些经理起草裁员名单。...
日期:10-31
一加in2020pro「一加Ace 2 Pro游戏体验升级!网友:就冲这买首发了」
快科技8月3日消息,一加中国区总裁李杰为一加Ace 2 Pro预热。李杰表示,一加Ace 2 Pro搭载Pixelworks X7独显芯片,在游戏帧率和画质上将迎来全面升级:1、超级分辨率功能将适配到所...
日期:08-03
2022网易未来大会拉开帷幕:熵变 启程
更多精彩内容,请关注 《2022网易未来大会》专题报道浮华褪尽,终见科技新生。12月22日,由杭州市人民政府和网易公司联合主办,杭州市经济和信息化局、杭州市商务局、杭州滨江区...
日期:12-22
喜迎开学季!陕西移动全方位保障助力校园迎新「移动高校迎新活动」
通信世界网消息(CWW)经过暑假的休息,元气满满的学子们踏入校园,开启求学之旅。陕西移动全力服务“开学季”,精心做好网络保障,积极拓展校园信息化应用,开展“反诈进校园”活动,全方...
日期:09-05
GPT-4玩《我的世界》15倍速攀科技,不看画面全靠代码操作
克雷西 发自 凹非寺量子位 | 公众号 QbitAI把GPT-4放进一个虚拟世界会怎么样?比如《我的世界》。英伟达开发最新方法Voyager,在游戏中点亮科技树的速度是此前方法的15.3倍,同时...
日期:05-28
OPPO平板预计明年上半年发布_oppo平板最新消息
  9 月 30 日上午消息,新浪科技获悉,在近日的合作伙伴峰会上,OPPO 副总裁、中国区总裁刘波透露,OPPO 正在拓展新的平板电脑,还有一些多形态的智能手机产品。预计将在明年上半...
日期:07-17
红米k60什么时候发布「Redmi K60发布会直逼地址 K60系列发布会直播几点开始」
Redmi K60系列手机将在12月27日晚正式发布,该系列将至少发布三款型号Redmi K60E、Redmi K60和Redmi K60 Pro,这里我们来一起看下K60系列发布会时间以及发布会有哪些产品。路特...
日期:12-27
非法集资1395亿!网贷“带头大哥”周世平涉及的刑事案件已进入审理阶段
  据界面新闻报道,9月15日,记者独家获悉,有“网贷教父”之称的红岭创投实控人周世平等18人已被移送深圳中级人民法院接受审判,立案时间为9月8日,目前已经进入审理阶段,会择期开...
日期:09-26