您的位置:首页 > 互联网

异军突起的视频AI,揭示了什么?_异军突起是褒义还是贬义

发布时间:2023-10-11 22:49:16  来源:互联网     背景:

声明:本文来自于微信公众号AI新智能(ID:alpAIworks),作者:举大名耳,授权转载发布。

悄然崛起的视频AI,标志着AI竞争进入了下一阶段。

在当下的AI赛道上,AI聊天、绘画一类的应用,早已枝繁叶茂。

然而,在此类同质化应用扎堆的情况下,一类颇有技术难度,也较少被人提及的方向,正在悄然崛起。

这就是最能调动人感官的视频AI领域。

根据twitter上的作者Will 郎瀚威统计的图表,今年8—9月,各大文生图类AI网站的访问量均开始呈现下降趋势。

然而,就在这种情况下,国外知名视频AI网站HeyGen的访问量上升了92%,流量跃居各大独立AI网站之首。

那么,为何此前一直默默无闻的视频AI,最近突然异军突起,盖过了风头正盛的文生图类AI应用?

而在GPT-4V发布,多模态技术不断取得突破的情况下,这一微妙的变化,又预示着什么?

1

异军突起的视频ai,揭示了什么

多模态的前奏

从AI发展的大格局上来说,HeyGen的这波流量上升,或许只是多模态高歌猛进背景下的一个插曲。

从谷歌宣布Gemini具有多模态功能的消息,到OpenAI发布GPT-4V,各个AI巨头,似乎都将下一阶段竞争的焦点放在了多模态上。

那为何多模态成了巨头眼中关键的“突破点”?

原因或许就在于,其具有打破“专业壁垒”的意义。

在多模态尚未取得突破之前,不同模态、领域之间,存在着巨大的鸿沟。

微软的聊天机器人有

写文案,做编辑的人,即使再妙笔生花,如果缺乏相应的美术知识,以及各种专业的提示词,也难以用AI画出出色的作品。

而一个画师如果没有受过专业的写作训练,缺乏谋篇布局的思路,也难以凭借AI写出上乘的文章。

类似的“壁垒”,在视频剪辑方面,也同样存在着。

根据知乎上一位视频剪辑方面的从业者介绍,一个完整的视频剪辑流程,包括了调色、整理素材、配字幕等一系列工作,要想熟练地进行剪辑,必须掌握PR、Edius、剪映等多种剪辑软件,同时还需熟悉各种转场、调色、粒子特效等插件的使用。

如果想让视频呈现更丰富的效果,还要掌握b-roll转场、字幕遮罩、坡度变速等复杂的操作。

此外,素材的搜集和整理,也是剪辑工作中的一大“苦活”,倘若题材较为冷门,素材就会很不好找。有时尽管遇到了好的素材,也可能由于版权问题难以使用。

正是由于上述原因,视频剪辑,注定不是一个简单的、易于掌握的技能。

以国内知名网站B站为例,据一位B站上百万粉丝的UP主团队透露,为了保证视频更新的效率、质量,这些账号往往会配备数名较为熟练的剪辑人员,轮番进行剪辑。

异军突起的视频ai,揭示了什么道理

那么,倘若有一种智能化的AI剪辑应用,能根据创作者想表达的思路,自动、高效地完成整个视频的制作,视频制作领域,又会发生怎样的颠覆呢?

实际上,这样的技术早已出现。

下面这两张图片,分别来自两段不同的视频片段。

你能分辨出哪个是真人,哪个是AI生成的吗?

答案是:这两个视频都是100%由AI生成的人像视频。

而它们均出自此前提到的HeyGen之手。

在HeyGen上,用户只需要用上传一段2分钟的小视频,就能达到和真人一样的效果,即使是像手势、面容和口型这种“细微肢体语言”也能调整。

而这类效果的实现,正是当下多模态技术发力的开端。

2

视频AI之力

上面所有这些视频都出自HeyGen的Joshua Avatar2.0,一款AI人像视频的工具,主打的就是一个超逼真。

而实现这样真实的视频效果,步骤也非常简单,只需完成选形象—写文本—输出三个步骤即可。

异军突起的视频ai,揭示了什么

如果要论HeyGen与其他同类视频AI应用最大的区别,就是它可以利用现有数据来创造全新和从未有过的内容。

以往的类似应用,例如D-ID,虽然也能让用户从照片或者AI形象中生成视频,但是这样的技术,更多是基于复制或处理已有的内容的AI技术。

这些技术虽然也可以制作视频,但是需要用户提供自己的照片或录音,或者从D-ID提供的一些固定的AI形象中选择。这样就需要用户花费更多的时间和精力来准备和上传素材,也限制了用户的选择和定制空间。

而相较之下,HeyGen的技术则可以让用户从文本中直接生成视频,并使用多种不同的AI形象和声音。

目前,HeyGen提供超过100+数字人素材和模板,广告、电商、新闻等一应俱全,也可以自己编辑PPT生成。

同时,HeyGen还支持300+不同音色和40+语言,以及视频翻译功能。用户可以一键将视频无缝地翻译成其他语言,这对于跨国和多语言的沟通非常有用。

通过这种定制化的、排列组合的方式,HeyGen可以快速、精简地制作出各种适用于多种场景的视频。

而这样的高自由度,也让HeyGen使许多不精通视频剪辑的人,打破了以往“技能边界”,可以恣意地用视频表达自己的想法。

除了HeyGen之外,在视频AI领域,许多正在蓄势待发的类似应用,也已经在悄然崛起。

例如能直接将脚本转化成视频的Pictory.AI就是其中之一。

Pictory 允许用户仅通过几次点击,就能将脚本转化为配有逼真的AI语音、匹配的素材和音乐的专业质量视频。

具体来说,在制作视频时,用户可以从Pictory 提供的多种模板中选择一种,来设置视频的样式。

之后,Pictory 会根据用户输入的文本和选择的模板和比例,自动地生成一个故事板。故事板是一个由多个场景组成的视频序列,每个场景包含了文字、图片、AI语音和一段音乐。

最后,用户可以在故事板上预览视频的效果,并进行一些编辑和调整。

如此一来,团队不需要昂贵的摄影师、剪辑师,也能制作出专业的、高质量的视频。

同样地,用3D CGI角色替换真人演员的Wonder Studio,也是旨在提高视频制作效率的AI应用之一。

Wonder Studio 是一个基于网页的视频平台,它可以让用户轻松地将任意的计算机生成的角色(CGI character)添加到任何场景中,使用AI技术来实现无缝的融合。

用户只需要拍摄自己想要的场景,并上传到网站上,Wonder Studio 的AI引擎就会自动分析场景中的演员的表演,包括他们的动作和面部表情,并将这些信息转换成运动数据,然后用这些数据来驱动用户选择的CGI角色。

这样,用户就可以完美地用3D CGI角色替换真人演员,无需使用复杂的3D软件或者昂贵的制作设备,例如动作捕捉服。

3

趋势及国内现状

从以上视频AI的技术特点中,我们至少可以总结出目前视频AI技术的两大趋势:

app的内存为什么会越用越大

1、制作流程极大简化

利用生成式AI技术,人们能够以自动化、智能化的方式,将文本、图像、音频、视频等多模态数据重新组合,来创造全新和从未有过的内容,在降低成本的同时,也打破了各个模态(或专业)之间的“技术壁垒”。

而这一壁垒的打破,正是生成式AI走向通用化、普及化的关键。

小米多看电纸书一代

2、内容的多样性和定制性

利用多模态AI的技术,人们能够处理和关联多种信息模态,从而在内容创作过程中,更好地表达自己的个性和风格,并适应不同的场合和目的。

这是以往受限于已有素材的单一模态技术难以实现的。

在上述两大趋势中,目前国内的视频AI应用,只勉强做到了“简化”这一步。

虽然国内目前也有一些与HeyGen类似的AI视频应用,例如腾讯智影、一帧秒创、万彩微影等。这些应用也利用了AI技术来简化视频创作过程,并提供了文本配音、文章转视频、数字人播报等功能。

然而,在具体的生成效果方面,国内应用的视频清晰度、素材丰富度,以及定制化功能方面,仍与HeyGen等应用有着较大差距。

腾讯智影的数字人视频,可选素材比较有限

从总体上来说,这类应用仍旧只能在平台提供的素材库内,选择有限的元素进行创作,并且在某些类别(如数字人视频)上,国产应用生成的视频,也未达到HeyGen视频那样流畅、逼真的标准。

如果说,在本轮AI革命中,国内视频AI技术仅仅止步于“降本”这一环节,从长远来看,是远远不足以征服智能化时代的观众的。

从当下观众的态度来看,AI制作的视频仍处于一种“不受待见”的状态,很多观众仍然觉得,在视频中使用AI技术,是一种偷懒、不负责,且廉价的制作方式。

究其原因,是因为当下国内的部分AI技术,仍未突破一种感官上的阈值,仍然让人明显觉察到“这不是人做的”。

于是就给人造成了一种“没有感情”、“粗制滥造”的印象。

更有甚者,甚至将那些使用了AI技术的视频,打上了“营销号”的标签。

面对这样的环境,任何珍惜自己羽毛的视频创作者,都不敢轻易使用AI技术了,因为生怕被人当成“营销号”,扣上“粗制滥造”的帽子。

生成式AI的进步,确实极大简化了视频制作的流程,但在已经到来的智能时代,观众们已经不想再看到那些批量的、流水线式的“低劣”视频了。

而要想摘掉这样的“低劣”标签,真正地让作品具有感情和灵魂,除了一个劲儿地“降本”之外,在个性化、拟真度,以及素材丰富性方面,国产视频AI还有很长的路要走。


返回网站首页

本文评论
电商平台上的超低价百度网盘会员,真的买不得_如何低价购买百度网盘超级会员
声明:本文来自微信公众号“三易生活”(ID:IT-3eLife),作者:三易菌,授权转载发布。低价订阅会员的出处,基本就是这些了。一年前阿里云盘的上线,可谓是成为了长期波澜不惊的国内网盘...
日期:10-26
因热爱发光,为热爱加冕丨2020年OPPO游戏中心琥珀大玩家精彩活动回顾
  时光如白驹过隙,不知不觉就已经来到2021年。   回首2020年,注定成为多数人记忆中不平凡的一年。在特殊环境下,OPPO游戏团队克服种种困难,坚信“每一份热爱都值得全力以赴...
日期:07-16
马斯克星舰飞船计划「马斯克:四年内将让“星舰”飞船上火星!终极目标是移民火星」
快科技10月7日消息,马斯克的火星梦”计划已经公布多年,他最终的计划是成功让人类可以移民火星,并在火星上建造一座城市。马斯克近日又谈起了这个宏大的计划,称SpaceX可能会在3-4...
日期:10-07
苹果15pro尺寸「惊艳!iPhone 15 Pro屏幕量产」
据报道,苹果的主要OLED屏幕供应商三星已获得iPhone 15系列所有四款机型显示器的批量生产批准。另外两家供应商LG显示和京东方仍在等待批准。iPhone 15 Pro和Pro Max的边框将...
日期:08-03
英伟达竞争的企业_英伟达、英特尔、AMD等芯片巨头集体萎靡,PC销售热潮已退
迅雷赚钱宝现在还赚钱组装macbook pro   过去近两年,当疫情期间人们被隔离在家时,PC出货量出现爆发式增长。而现在,这样的增长终于消失。   当地时间8月8日,存储芯片公司美...
日期:08-15
研究抖音5年,我发现涨粉快的达人都玩好了“反差感”
声明:本文来自于微信公众号卡思数据(ID:caasdata6),作者:岳遥,授权转载发布。5月的抖音内容生态呈现出了怎样的局面?我们一起来看榜:从整体增粉情况来看,5月涨粉榜相比前几个月似...
日期:06-15
甘肃完成首次储能电站并网适应性检测,新能源装机规模突破4000万千瓦
通信世界网消息(CWW)据央视报道,甘肃储能电站电网适应性首次检测在海拔1700米左右的甘肃张掖民乐县南古镇三墩滩圆满完成。据介绍,甘肃省新能源装机规模已突破4000万千瓦,占全省...
日期:09-13
中国网络普及率超过全球平均水平_统计显示:中国网速不到全球平均水平的一半
  昨天,中国互联网络信息中心(CNNIC)发布的统计报告显示,截至2010年12月底,我国网民规模达到4.57亿,较2009年底增加7330万人,但我国平均网速却不足全球水平的二分之一。   《...
日期:07-25
vivo骁龙765g相当于什么处理器_搭载骁龙765G处理器,vivo Z6性能强劲售价令人期待
  2月29日,“5G性能先锋”vivo Z6即将正式预售。全新vivo Z6实现了双模5G SA/NSA全网通,搭载骁龙765G 5G SoC,支持全场景网络优化,强劲的性能让用户快人一步畅享极速的5G网络...
日期:01-27
英伟达发布40系旗舰显卡:搭档台积电 表现较前一代提高2-4倍「英伟达40系显卡上市时间」
黄仁勋骄傲地宣布,全世界最好的游戏平台,又变得更强了。财联社9月21日讯(编辑 史正丞)当地时间周二,英伟达召开九月全球开发者大会,在畅谈人工智能和元宇宙开发平台Metaverse之余,...
日期:09-22
工信部推出号码“一键解绑”功能:淘宝、微博手机号可一次性解绑
  大家一定遇到过,很多时候App已经不用了,但还经常会受到平台的短信等等,但解绑需要重新下载登陆,整个流程较为繁琐,因此很多人也就懒得去操作。  现在,工信部官方推出了一键...
日期:06-21
李一男造车迷局:公司成立4年,新车交付的临门一脚,黄了!_李一男 造车公司
作者丨普子胥出品丨网易科技《态℃》栏目组“我起起伏伏的人生,如同过山车一样。”2015年6月1日,风光无限的李一男曾在小牛电动首款车型N1发布会现场上感慨万千。这一天,是他45...
日期:12-12
如何实现与用户可持续的沟通?美团跑腿给出了答案
声明:本文来自于微信公众号 营销兵法(ID:lanhaiyingxiao),作者:兵法先生,授权转载发布。这几年,有很多品牌正以年轻化的姿态,颠覆着大众对于某些品类的刻板认知——像火出圈的神车五...
日期:12-25
苹果热搜第一「苹果上半年上热搜次数高达117次!竟然比华为还多」
7月13日,2023上半年微博热搜趋势报告重磅发布,上半年热搜爆词167个,其中热搜十大关键词、十大影视综艺作品、十大手机品牌、十大汽车品牌、十大游戏、十大运动员、十大动漫等热...
日期:07-14
华为 u8110「华为 u8230」
华为 U8110是一款华为公司于2010年推出的智能手机。该款手机使用的是安卓2.2系统,搭载了高通MSM7225处理器,内置了256MB RAM和512MB ROM存储空间,并支持最高32GB的扩展存储。在...
日期:05-30
苹果 macOS Big Sur / Catalina 的 Safari 15.6.1 正式版发布,修复严重漏洞(macos big sur beta11.0.1)
  8 月 21 日消息,苹果本周发布了 iOS 15.6.1 和 macOS Monterey 12.5.1 正式版,两者都具有安全增强功能。为了将这些安全增强功能带给更多用户,苹果发布了适用于运行 macO...
日期:08-22
iPhone15最高补贴800!天猫携45+电子消费品牌集体加码“以旧换新”补贴_天猫苹果12618活动
10月将至,不少消费者已开始在购物车里为双11大促默默囤货。尤其是大家电、智能手机、电脑、电器这类高单价产品,基本都被压在购物车里,苦等着大促底价出现的那一刻。不过这个10...
日期:09-30
arm价格「分析:Arm值520亿美元的估值吗?」
9月8日消息,本周二,Arm提交IPO申请,每股ADS定价在47-51美元之间,总计发行9550万股ADS。据此估计,公司估值大约为520亿美元。Arm所有者日本软银公司向持怀疑态度的分析师和投资者...
日期:09-08
XSKY发布XE2000系列SDS一体机两项新特性
  企业客户数字化转型过程中,软件定义存储(SDS)一体机帮助用户搭建了通向敏捷IT的捷径,同时也带来了显著的客户收益(*数据来源XSKY多个落地项目的实际测算):   1、缩短50%...
日期:10-27
重磅!我国首次火星探测任务一批科学研究成果发布,火星上有水吗?答案来了!我国还实现了这个“首次”
据央视新闻18日消息,据国家航天局探月与航天工程中心消息,我国首次火星探测任务一批科学研究成果发布,科学研究团队通过相机影像和光谱数据,在着陆区附近的板状硬壳岩石中发现含...
日期:09-19