您的位置:首页 > 互联网

张一鸣的对手,多了一个又一个_张一鸣的对手,多了一个又一个人

发布时间:2024-07-29 17:24:07  来源:互联网     背景:

声明:本文来自于微信公众号 字母榜,作者:马舒叶,授权转载发布。

进入7月,文生视频赛道动作不断:智谱AI推出AI生成视频模型智谱清言,用户可在30秒内免费生成6秒视频;快手可灵迎来全面开放测试,并正式上线会员体系,月费分为66元、266元和666元三档。

据字母榜(ID:wujicaijing)不完全统计,仅国内,目前便有超20家公司推出了自研AI视频产品/模型。非凡产研数据显示,2024年上半年,仅文生视频领域全球有18次融资活动,其中12起融资都集中在国内。

在今年2月份Sora震撼发布前后,前抖音CEO张楠几乎同期转岗剪映,并表示将推出一个AI生图和视频产品。但近半年过去,面对国内其他玩家在成为Sora的“国产平替”的竞赛中,字节在文生视频领域却推进缓慢。

更糟糕的是,新竞争对手还在不断赶来的路上,如今字节最新的对手是MiniMax。

我是不是雷军的爸爸

接近MiniMax的人士告诉字母榜,如今MiniMax正在内部开发视频大模型,可能会植入星野AI或海螺AI内,作为单个应用场景出现。

对此,MiniMax商业化负责人魏伟回应称,现在包括MiniMax在内,各家大模型公司都在做文生视频的尝试,但对MiniMax来说,文生视频的技术仍在早期阶段。目前MiniMax对AI音频或AI视频的推出还没有明确计划。

作为国内“AI四小龙”之一,MiniMax由闫俊杰创立,3月,MiniMax官宣了由阿里巴巴领投的6亿美元,投后估值达25亿美元,根据非凡产研数据,6月,MiniMax旗下星野AI的月活为400万人,海螺AI的月活为200万人。

不管是MiniMax、还是智谱AI,切入文生视频的“军备竞赛”,背后都有着对流量的焦虑。

6月6日,快手的文生视频大模型可灵发布,一口气把视频生成的时长提到了2分钟级。上线不到两月,申请内测可灵的用户已经超过了70万。而根据非凡产研数据,6月,MiniMax旗下海螺AI下降量为176万人,环比下降19.95%。

尽管非凡产研CEO吴畏表示,整个6月,聊天类AI产品数据均有下滑,属于行业整体状况。但对于MiniMax、智谱AI们而言,无论是开发自己的视频大模型,还是将文生视频作为单个功能场景插入原本的大模型内,都不失为一个引流的优选。

张一鸣的对手,多了一个又一个是谁

引流之外,对于坐拥短视频业务的字节而言,文生视频还将加强剪映等视频剪辑工具的能力,并有望带动平台内容供给的丰富度。

面对各路友商在文生视频领域的步步紧逼,字节不得不迎头跟上。

张一鸣有多牛

A

在文生视频领域效用不显的大厂,不只有字节一家。

宣布要“All in AI”的百度,年初推出的AI视频模型UniVG正在内测阶段,阿里达摩院推出了AI视频产品“寻光”。

而根据晚点LatePost报道,2024年一季度,字节 AI 研发团队将视频生成模型的优先级排在了前面,还挖来了原Google视频生成模型VideoPoet项目负责人蒋路。2024年1月,字节推出一款AI视频生成工具——MagicVideo-V2,支持从4K到8K的超高分辨率视频生成。随后2月,剪映推出名为Dreamina的AI绘画工具。3个月后,剪映Dreamina正式更名为“即梦”,上线AI作图和AI视频生成功能,生成时长为3-12秒。

腾讯不仅自己的AI实验室推出了视频生成模型VideoCrafter2,同时腾讯混元团队还联合中山大学和香港科技大学共同研发了视频大模型Follow-Your-Pose-v2,上传一张人物图片、提供一段动作视频,就能让图片人物模仿视频中的动作,视频可达10秒。

腾讯集团副总裁蒋杰更表示,腾讯混元已支持文生视频、图生视频、图文生视频、视频生视频等多种视频生成能力,且已拥有16s视频生成的能力。

继Sora激起文生视频讨论热潮,快手推出可灵,将文生视频从60秒拉长到2-3分钟,文生视频赛道也引发了AI创企们的争夺。

除了MiniMax和智谱AI之外,Morph AI的Morph Studio、爱诗科技的PixVerse、MewXAI的艺映AI、右脑科技的Vega AI,虽已经在AI视频领域占据一席之地,也在不断迭代产品。

但不是所有大模型企业都将研发“国产Sora”摆在了优先战略级。

长文本起家的月之暗面,在OpenAI推出文生视频模型Sora引发关注之际,完成了超10亿美元的新一轮融资。当同样由阿里领投的MiniMax已经传出正在研发视频大模型的消息时,月之暗面在长文本之外,仍未有新动作传出。

成立百川智能的搜狗前CEO王小川,更是在3月份一次采访中表示,百川不走Sora路径。他认为像Sora之类的文生视频模型既不靠近AGI理想,也不靠近现实场景,Sora的高度、突破性、应用价值都低于GPT。

B

大模型厂商争卷文生视频,显然是因为看好AI视频“钱景”。

根据公开数据,早早在APP里支持“一键AI美颜”的美图,由连年亏损,到2023年总收入27亿元,同比增长29.3%,经调整后归母净利润3.7亿元,同比增长233.2%。而这一增长主要源于AI推动主营业务收入增长,如今美图用户每天处理数亿份图片和视频,其中约83%都用到了泛AI功能。

以美图AI口播视频工具开拍为例,面向B端用户,即抖音、小红书、B站上的视频创作者。“用(开拍)来拍口播可以设置字幕,滤镜美颜也会更自然,甚至美图还有专门的APP Wink,恢复画质的功能也很好用。”某小红书博主告诉字母榜,如今做自媒体,除了剪映之外,美图的开拍、Wink已经成了她必用的剪辑工具。

前字节视觉技术负责人、爱诗科技创始人兼 CEO 王长虎亦表示,在过去的移动互联网时代,国民级产品一定包括抖音、TikTok、快手,视频相比语言更贴近用户,未来产品化和商业化的可能性更大。

对于尚在用投流换用户,仍处在亏损中的AI创企如MiniMax等大模型厂商们来说,文生视频已然成为极具诱惑力的商业化新场景。

更不用提,上线不到两月,申请内测可灵的用户已经超过了70万。在用文生视频“让特朗普说rap”“让李白跳抖肩舞”的互联网造梗狂欢里,AI视频正在创造新的流量入口。

对于需要用日活和下载量证明自己的AI创企而言,社交平台的投流成本居高不下,研发视频大模型,将文生视频植入原本的AI工具内做流量入口,无疑会帮助正在亏损中的大模型初创公司,尽可能压缩成本。

此外,对于MiniMax们来说,想要承接由于OpenAI禁用API端口调用而寻找“下家”的B端用户,不论是用AI生成电商平台的门店物料,还是视觉创作、商业摄影、专业视频编辑、商业设计等其他领域,文生视频功能的载入,都能吸引一批“荷包更鼓”的B端用户。

但对于“不缺钱”的互联网大厂如字节等短视频平台,“卷”文生视频赛道,还有着关乎核心业务的重要考量。

在文生视频领域动作频频的剪映,既是视频创作的工具,也和抖音的内容生态息息相关。而面对快手可灵的“先发制人”,美图开拍等APP的紧逼,对于持续引导视频创作者在创作完成后“一键发布到平台”的大厂来说,对创作入口的争夺,直接关联着背后内容生态的建构过程。

此外,无论是由抖音和博纳合作的AI科幻短剧《三星堆:未来启示录》,还是快手原创的AI奇幻短剧《山海奇镜之劈波斩浪》,对于巨头APP如抖音、快手而言,文生视频的AI技术也能够更大程度地丰富平台内容。

同时,头豹研究院数据显示,2021年中国AI视频生成行业的市场规模为800万元,预计2026年,这一市场规模将达到92.79亿元。截至2023年底,该赛道已经出现了独角兽公司:Midjourney估值100亿美元,Stability AI估值40亿美元,Runway估值15亿美元。而年初爆火出圈的Pika,刚刚成立不到一年,已于6月5日,宣布完成8000万美元B轮融资,估值达到4.7亿美元。

根据非凡产研数据,2024年上半年,仅文生视频领域全球有18次融资活动,其中12起融资都集中在国内,其中爱诗科技A轮融资达1亿元,生数科技A轮融资达数亿元,千万甚至亿级的融资数额,也展示了资本市场对文生视频的热切关注。

需要不断融资满足单月百万级别大模型运行费用的AI创企,想要把握投资人的心,也需要文生视频这个新故事。

C

但想用AI视频引流、做商业化,对资本市场讲出新故事,仍面临重重挑战。

2月中旬,OpenAI的文生视频模型Sora引发热议,可以生成长达1分钟的流畅视频,尽管3月OpenAI CTO已透露计划“今年晚些时候”正式推出Sora,但迄今为止,Sora仍未开放公测,仅向一些艺术家定向提供内测。

迟迟不进行公测的Sora,或许指向的正是AI视频生成的质量问题。曾担任阿里巴巴智能设计实验室负责人,打造了AI设计平台“鲁班”的特看科技创始人吴春松(花名乐乘),也面向国内出海商家和海外本土企业推出了视频AIGC生成平台,他表示,“在产品面向C端用户的初期,用文生视频需要尝试25次,才能生成一次可用的视频,对于用户来说,抽卡概率太低。”

B站某UP主则告诉字母榜,如今用国内几家文生视频大模型,“想要生成和文字描述准确的结果,很多情况下更看运气,尝试10次下来,调整后有3-4次能用,就已经是技术做得很不错的模型了。”

为了解决文生视频质量不稳定的问题,特看科技通过“文生图、图生视频”的技术迭代,让AI视频生成成功的概率从1/25提升到1/10(生成10次成功1次)。但对于专业的视频创作者来说,想要真正地实现用AI生成可用度较高的商用视频,就不能只是社交平台上风靡的“复活老照片”这类简单易复制的操作,对于AI生成视频的分镜、剧情的准确性,甚至镜头效果的美观程度和一致性,都提出了更高的要求。

反观现在国内的视频大模型,即使是在时长和准确度上表现不错的可灵,也因为“平台用来训练模型的基础语料仍然不够,跳出擅长的美食和人像领域,视频生成的准确度就会下降。”

除了生成质量不稳定之外,文生视频的商业化路径也也并不容易走通。

除了坐拥美图秀秀这一稳定流量入口的美图,即便是国内的短视频超级APP抖音和快手,也尚未打造出破圈的商业化作品,更多依然是与影视制作团队的内部合作项目。

即便选择了出海,包括5月在海外用户量已经高达176万的爱诗科技PixVerse、在海外音视频剪辑领域占据头部的字节Capcut,商业化路径也并不明晰。在出海的AI视频工具内,只有HeyGen由于为企业定制营销数字人视频,在一年内实现了从100万美元到3500万美元的增长。

模糊不清的商业化路径,加上单月百万级别的研发成本,对于AI大模型厂商们来说,文生视频这场“大考”,恐怕并不好过。

仍处在赔本赚吆喝阶段的文生视频赛道,某种程度上也给了张一鸣更多追赶的时间。


返回网站首页

本文评论
全面掌握甲骨文云 OCI MySQL 服务:从自动运维到高效管理_甲骨文云 vps
Oracle OCI 中的 MySQL 数据库服务全景在 Oracle Cloud Infrastructure (OCI) 中,客户可以根据自己的业务需求和技术背景,选择三种不同的 MySQL 服务。这些服务包括:MySQL Datab...
日期:05-23
六大设计理念,华为云城市智能体让城市更智能_华为全场景智慧生活五大场景
  5月17日,中国天津。华为云带来了城市智能化解决方案,面向全球介绍了“华为云城市智能体”如何助力天津城市数字化建设,开启智慧新生活。 华为云EI服务产品部总经理贾永利...
日期:04-15
ai 3d模型「Adobe研究人员研发新AI模型LRM:实现从2D样本瞬时生成3D图像」
**划重点:**如何开通视频号发视频小米civi 2哪个颜色好看1....
日期:11-14
将主要用于电动汽车投资,韩国现代宣布从海外子公司回收59亿美元分红
6 月 12 日消息,韩国现代汽车集团近日宣布,将动用其海外子公司的储备金,以确保必要的财务资源,例如扩大对国内电动汽车领域的投资。具体而言,现代汽车今年计划提高部分海外子公司...
日期:09-24
阿里云宣布开源通义千问70亿参数模型「阿里开源软件」
8月3日 消息:阿里云宣布开源通义千问70亿参数模型,包括通用模型Qwen-7B和对话模型Qwen-7B-Chat,两款模型均已上线魔搭社区,开源、免费、可商用。手机蓝牙音量记忆华为P50 Pocke...
日期:08-03
一夜淘汰700人!ChatGPT之母:AI自动化取代人类,创意性工作可能消失
声明:本文来自于微信公众号 新智元(ID:AI_era),作者:桃子 乔杨,授权转载发布。【新智元导读】AI淘汰大部分人类似乎就是一场终局。OpenAI CTO在采访中称,一些创意性的工作会消失...
日期:06-24
唯品会第二季度营收245亿元 Non-GAAP净利润16亿元_唯品会盈利模式分析
讯 北京时间8月19日下午消息,唯品会(NYSE:VIPS)今日发布了截至6月30日的2022年第二季度财报。财报显示,唯品会第二季度总净营收为245亿元(约合37亿美元),而去年同期为296亿元。归属...
日期:08-20
文心一言企业服务测试Demo发布 PPT制作、旅行规划、生成带货脚本等
4月24日 消息:日前,文心一言企业服务测试官方Demo正式发布。官方表示与IT互联网、政务、金融、电商零售等各个行业的合作伙伴,在内测环境下,基于企业应用场景打磨了样板间Demo...
日期:04-24
太惊艳!红米K70渲染图首曝:抢先小米14首发骁龙8 Gen3+超窄边框「红米k7pro」
要说接下来最受期待的新机,无疑是9月份即将发布的苹果iPhone15系列,而国产手机这边则是酝酿1年时间准备更加充分的华为最强旗舰Mate60系列。而除了这两位外,同样将在年内更新的...
日期:07-12
锐龙8040系列Hawk Point APU阵容揭晓:明年初推出的一个小更新_锐龙4850g
AMD的新一代锐龙8040移动处理器最大可能是在CES 2024上正式发布,目前已知它的代号是Hawk Point,现在它的产品型号列表已经流出,囊括H、HS和U三大系列。iphone 11pro单卡Hawk Po...
日期:11-28
疫情期间协助警方破获诈骗案过万起 腾讯智能反诈中枢全链条打击网络黑产
  突如其来的新型冠状病毒在春节期间集中爆发,原定的假期也在不断延长。在全国抗击新冠病毒的同时,中小型企业、个体商户、企业员工也面临物资短缺和资金上的压力,不法分子...
日期:09-10
男子考科三「00后男生跳科目三后无法下蹲:膝盖疼痛难忍」
11月28日消息,据国内多家媒体报道,一位00后小伙跳了舞蹈科目三”后,膝盖疼痛难忍无法下蹲,最终诊断为胫骨平台骨挫伤”。苹果不提供充电器违法据悉,胫骨平台骨挫伤是指胫骨平台的...
日期:11-28
一加ace 3骁龙8gen3是满血版吗骁龙8 Gen3加持 一加Ace-3 Pro外观、性能全面升级
来源:中关村在线据数码业内资深人士透露,一加Ace 3 Pro将会采用1.5K曲面屏,并搭载高通骁龙8 Gen3平台。该款手机配置了16GB内存和1TB存储空间。其后置摄像头为5000万像素主摄。...
日期:04-21
小米集团:今日耗资约2417万港元回购270万股「雷军回购小米股票多少亿」
  小米集团9月30日公告,今日回购270万股公司股份,耗资约2417万港元。  手机怎么把照片缩小到100k什么意思iPhone5 电信...
日期:10-03
新机来临前的狂欢?iPhone13最新售价确定,果粉:幸福来得太突然_iPhone13系列预售首日,苹果官网崩了!
根据手机市场调研机构相关的数据显示,在今年第二季度国内高端市场份额占比之中,iPhone凭借着46%的占比再次获得了第一名的成绩,对于iPhone产品能够获得第一笔者并不感到意外,毕...
日期:09-11
618,电商平台上演“直播大战” | 618观察_618电商战绩
声明:本文来自于微信公众号伯虎财经(bohuFN),作者:灵灵,授权转载发布。淘宝:加码内容,打造更有看点的直播间据战报,淘宝直播618预售期间,李佳琦、香菇来了、蜜蜂惊喜社、烈儿宝贝、...
日期:06-21
开源文本到语音系统WhisperSpeech 通过反向工程实现_开源语音识别技术
1月22日 消息:WhisperSpeech是一个开源的文本到语音系统,其最大的亮点是通过对OpenAI的Whisper语音识别模型进行反向工程,实现了接收文本输入,并利用修改后的Whisper模型生成听...
日期:01-22
火星车数字人亮相世界AI大会,祝融号竟然还是百家号创作者_祝融号火星车
  2021年7月8日,第四届世界人工智能大会(WAIC2021)的开幕式上,火星车数字人祝融号惊艳亮相,跟百度创始人、董事长兼CEO李彦宏进行了一场特别的互动。   大会现场,火星车数...
日期:09-10
宝德计算机公司怎么样「宝德计算回应争议:暴芯CPU是在英特尔支持下推出的定制产品」
通信世界网消息(CWW)5月31日,宝德计算发布公告强调,暴芯首款CPU系在英特尔公司支持下推出的一款定制CPU产品。暴芯CPU主要面向商业市场的品牌PC终端使用,且暴芯CPU未向相关政府部...
日期:06-02
新机型即将上市2021「颜值机皇!新机官宣:1月18日,正式发布」
随着旗舰芯片发布后,各大手机品牌的旗舰机也不断发布,不仅仅如此,还有影像手机和游戏手机也发布,所以近一二个月的新机市场竞争比较激烈。不过,三大机皇还没有发布,比如华为Mate70...
日期:01-14