您的位置:首页 > 互联网

AI视频创作一条龙!达摩院“寻光”平台炸场WAIC,突破可控编辑难题

发布时间:2024-07-05 19:25:54  来源:互联网     背景:

声明:本文来自于微信公众号 量子位 (ID:QbitAI),作者:鱼羊 ,授权转载发布。

AIGC时代,视频创作这事儿真的不一样了。

就像这样,轻轻一圈,选定目标立刻变身单独图层,再丝滑嵌入不同的背景视频,场景变换so easy~

想要调整一下镜头角度,交给AI,同样能一键完成:

还能一键消除、修改目标:

后期再也不用加班加到手抽筋(doge)。

三星的ssd为什么那么贵

划!重!点!这还不是实验室里的单一技术demo,而是马上就要开放内测,让创作者们直接可以用起来的一站式AI视频创作平台——“寻光”。

就是说,传统上分散在不同制作流程中的剧本创作、分镜图设计、视频素材编辑等步骤,现在都可以在AI加持下,在同一个平台上流畅完成。

这就是阿里达摩院在上海世界人工智能大会上带来的最新惊喜。

演示一出,现场的观众都坐不住了。

而达摩院官方,也透露出了AI视频领域新成果背后更大的“野心”:

不对标Sora,而是走自己的路,希望更快让AI生产力匹配人类想象力。

“寻梦光影间”

所谓寻光,意指“寻梦光影间”:

即通过人工智能技术,提供全新的视频创作模式。

与Sora等今年备受关注的AI视频生成模型不同,寻光关注到的,是“Sora之后,视频工作流的变革”。

达摩院认为,Sora等AI视频生成模型给足了人们对视频生产方式彻底变革的想象力,但一方面,AI视频内容的可控编辑,包括对复杂剧情的理解、生成对象的一致性等,仍然是当前算法所面临的一大挑战。

另一方面,业界尚没有统一的AI视频编辑平台,能让创作者们一站式体验到AI加持的视频创作全流程。

举个例子,OpenAI创始成员Andrej Karpathy最近也玩上了AI视频,整出了个AI版《傲慢与偏见》。

在这个短片的制作过程中,他用到的工具包括Claude、Ideogram、Luma、ElevenLabs、VEED……而他本人也抱怨说:

老实说这个工作流非常混乱,工具与工具之间存在大量的复制粘贴,3个片段的简单小视频就花了我大约1个小时的时间。

买件防晒衣

这里面存在一个巨大的机会。谁正在打造100%的AI原生视频制作平台?

达摩院打造寻光,定位为PUGC一站式AI视频创作平台,目标正是针对以上问题,用AI能力重塑传统视频制作的全流程。

具体来说,寻光可以辅助用户创作剧本、分镜图等,支持对生成及上传素材进行丰富的AI编辑,包括人物控制、场景控制、运镜控制、目标新增/消除/修改等10多种功能。

并且在交互方面,主打“让视频编辑像操作PPT一样简单”。

以分镜设计环节为例,上传到寻光的原始视频素材,会由算法切分成多个分镜头。

在创作空间里,用户可以方便地查看到每一个分镜头,并用简单的拖拽操作对其进行调整。

在新建的空白分镜中,除了添加已有素材,寻光平台还支持用户调用多种多模态生成模型,生产新的内容。

而在编辑功能方面,寻光强调的是精细化的编辑和控制:在AI加持下,依据用户意图,在语义层面而不是像素层面实现编辑;同时,视频里的人体、人脸、前景、背景等任意局部目标,都可以进行精细化的编辑和修改。

在现场,达摩院视觉技术实验室高级算法专家陈威华着重提到了基于视频图层的编辑能力。

以前景图层功能为例,用户通过文本输入,即可生成符合描述的、具有透明背景的视频,并且一键就能将其融合到其他背景视频当中。

寻光也支持图层拆解功能,用户在视频第一帧选择想要提取的物体,算法就会自动跟踪,把整段视频中对应的目标拆解出来,形成独立的带透明背景的视频图层。

飘动的头发也扣得很精细的那种:

另外,在对视频全局元素的编辑方面,风格迁移上,寻光平台提供了20+不同风格。

运镜控制上,左右平移、上下平移、推进拉远、左右环绕等都能支持。

在对视频局部元素的编辑方面,除了目标消除,寻光平台还能实现人脸的精准控制:

△视频取自国风武侠动漫《少年白马醉春风》第三集

轻轻一拉实现运动控制:

如此看来,寻光可以说集成了市面上最完备的AI编辑功能,把一整个视频制作工作流都给AI化了。相比于在各种工具间跳来跳去,在传统工作流中零散地插入AI能力,属实更加方便、高效了。

重塑视频创作工作流

探索更理解物理世界规律、生成时长更长、生成效果更惊艳的多模态的模型,是当今工业界和学术界都密切关注的方向。

但当更强大的AI面世后,人们能否更快掌握这种新型生产力,同样是值得关注的话题。

在Karpathy挑起话题之后,就有不少网友表示确实戳中痛点:

从一个工具转移到另一个工具会破坏工作状态,说实话,这限制了这些工具对效率的提升。

AI视频创作需要统一的UI。

陈威华也在WAIC现场谈到:

ff小股东集体起诉

今天我们正处在AI视频生成这场巨大变革之中,“工欲善其事,必先利其器”,我们希望寻光视频创作平台就是每一个人手中的利器,是每一个人的专属视频工作室,在这个平台上,AI与创作者之间能够更紧密高效地协作。

为此,寻光平台背后的达摩院视觉技术实验室已做了大量技术储备。

该实验室致力于多模态视觉信号的理解与生成技术研究,当前的重点研究方向包括更加精准的图像/视频/3D内容生成,更加可控的图像/视频/3D内容编辑,更加高效的生成框架,多模态的理解-生成框架等。

AIGC在全世界范围内引爆热潮,核心在于带来了生产力彻底变革的想象空间。

现在,解放生产力的第一步,已经开始落地实践,你期待吗?

官网地址:

https://xunguang.damo-vision.com/

mac studio m2测评

—完—


返回网站首页

本文评论
云电脑:运营商数字时代大生意
云电脑:运营商数字时代大生意 通信产业网|2023-08-11 17:02:27作者:崔亮亮来源:通信产业网AMD RADEON SOFTWARE【通信产业网讯】随着算力和网络共同步入算网时代,云计算成为了通...
日期:08-24
帮助用户保持正确的握持手机方式-苹果新功能_点趣教育是什么
来源:中关村在线沃尔玛的供应链管理有什么可借鉴之处骁龙处理器荣耀8英特尔13代酷睿移动处理器联想滑盖全面屏z5 pro为了帮助人们保护眼睛健康并降低儿童患近视的风险,苹果公...
日期:09-24
搜索算法大升级,微软Windows 10 20H1慢速预览版19025推送
  11月21日消息 上周,微软发布了新的Windows 10 20H1快速预览版19025。据悉在该20H1版本系统中官方优化了Windows Search indexer功能并修复了其他的错误。   现在微软...
日期:04-04
你为啥还不升级Win11?微软:1月31日停售Windows 10「微软为什么更新win11」
你为什么不升级Windows 11,是使用不习惯,还是门槛较高,还是别的原因呢,不管是什么,微软已经在帮大家做选择题了。申诉找回微信账号密码怎么操作微信号那里怎么写现在,微软已经宣布...
日期:01-26
武汉女快递员复工10天,收到上千次“谢谢,辛苦了”(武汉快递员辛苦送7个月快递)
  连日来,武汉快递业全面复工,苏宁物流、顺丰、邮政等12家大型快递企业火力全开!   继3月11日苏宁物流湖北地区大件到家服务全面开通后,进入3月下旬,武汉地区苏宁物流...
日期:12-08
博士坐火车打折吗「“感觉良好”!博士乘组回家,网友:他一定能看得见」
“感觉良好”“感觉良好”“感觉良好”“北京明白”英特尔和amd合作的cpu北京时间2023年10月31日8时11分,神舟十六号载人飞船返回舱在东风着陆场成功着陆,现场医监医保人员确...
日期:10-31
国家电网董事长年薪90万 在多家电力央企负责人中薪酬最高_国家电网管理层待遇
据中新经纬报道,近日,国家电网、中国华能、华电集团等多家电力央企陆续公布了2021年度企业负责人薪酬。其中,薪酬最高的是国家电网有限公司董事长、党组书记辛保安,其年薪90.69...
日期:01-31
谷歌母公司Alphabet再次授予CEO皮查伊股权激励 但进一步与绩效挂钩
  讯 北京时间12月22日早间消息,据报道,谷歌母公司Alphabet周三表示,已经批准向首席执行官桑达尔·皮查伊(Sundar Pichai)授予新的股权激励,同时将他的薪酬更进一步地与绩效挂钩...
日期:12-22
ai图片分辨率提升「Magnific AI本周更新!可将图片放大至10K*10K分辨率」
1月8日 消息:今天,Magnific AI创始人Javi Lopez在推特宣布,Magnific AI将于本周更新,可将图片放大至10K*10K分辨率。网易云音乐社交软件有玩AI绘画的小伙伴们,对Magnific AI想必...
日期:01-08
摩根士丹利称苹果AR/VR头显将于10月量产,备货30万到50万部「摩根士丹利vp 相当于」
6月2日,据美国科技博客MacRumors报道,摩根士丹利研报称,苹果传闻已久的AR/VR头显将在10月进入量产,并在12月前上市。苹果仍有望在下周的年度全球开发者大会(WWDC)上发布这款头显,并...
日期:06-03
奥特曼回归OpenAI后首次公开露面 称AI进步“有点吓人”_奥特曼退出
12月13日 消息:据外媒报道,山姆·奥特曼(Sam Altman)周一在一场公开论坛上首次露面,这是他在“OpenAI政变风波”后重新出任该公司 CEO 后首次公开露面。奥特曼在论坛上接受了采...
日期:12-13
360ceo周鸿祎「而是万模群舞-360周鸿祎再谈AI大模型,未来可能不是百模大战」
【】7月3日消息,由北京市人民政府联合工业和信息化部、国家网信办、商务部、中国科协共同主办的全球数字经济大会2日在北京召开,360集团创始人周鸿祎出席“2023全球数字经济大...
日期:09-22
GitHub发布编程字体家族Monaspace 支持混合使用5款等宽字体
11月10日 消息:近日,代码托管平台GitHub发布了一套名为Monaspace的开源编程字体家族。这套字体家族包含5种字体,分别是Neon、Argon、Krypton、Xenon和Radon。小米石墨烯取暖器...
日期:11-10
iQOO Neo7首发天玑8200:12月2日发布 已上架「iqoo天玑1000plus新机」
iQOO Neo7已经官宣首发天玑8200芯片,发布日期已经定在了12月2日,目前该机已经上架,此前Redmi K60也称要首发这颗芯片,此次也是被vivo抢先了,天玑8200集于台积电4nm工艺制程打造,最...
日期:11-29
畅享6x「1499元!畅享60 Pro即将发售」
华为官方宣布,畅享60 Pro将于5月25日正式上市发售。参与预售的用户可以享受100元的优惠,起售价为1499元。量子显卡这款新品拥有6.8英寸大屏,左右边框仅有1mm,屏占比高达94.9%,成...
日期:05-21
股价涨近5% 英伟达市值一夜大涨9600亿元_英伟达市值变化
美东时间周一,英伟达股价当日涨近5%,不仅刷新了历史收盘纪录,更推动其市值一夜之间大涨1320亿美元,折合人民币约9570亿元。抖音里面去旅行音乐这一显著涨幅的背后,源于公司创始人...
日期:06-04
姑娘年薪50万却毅然从银行离职 上班忙连喝水的时间都没有_女孩子年薪50万很厉害吗
校园招聘季节又到了,近期各大银行的校园招聘已进入笔试阶段。不少网友在社交媒体上分享了参加银行笔试的经历,称其难度极高。一位杭州股份制银行的员工告诉媒体,近年来招聘的新...
日期:04-24
三星s8处理器骁龙「唯一四边等宽的小屏骁龙8 Gen3旗舰!三星S24 1月登场」
快科技12月23日消息,博主i冰宇宙透露,三星Galaxy S24系列将于1月18日(北京时间)正式发布。和上代产品布局一样,这次发布会三星将同时推出Galaxy S24、Galaxy S24 和Galaxy S24 Ul...
日期:12-24
清明节前AI复活亲人成热门生意:几十元到上百元不等
3月28日 消息:随着清明节的脚步日益临近,思念亲人的情感愈发浓烈,而近日,一项名为“AI复活”的服务在市面上引起了热烈讨论。这一创新业务,通过利用人工智能技术,让逝去的亲人仿...
日期:03-28
马斯克:已确定特斯拉接班人、自己有意外他将接管公司「马斯克辞去特斯拉」
快科技5月24日消息,马斯克已经给推特找好了CEO,那么特斯拉是否也会有接班人呢?2022款奔驰eqc近日,马斯克表示,他已经向特斯拉董事会确定了一位接班人,如果自己发生意外,这个人将接...
日期:05-24