您的位置:首页 > 互联网

Sora问世 有望成为“世界模型”?

发布时间:2024-02-28 21:20:18  来源:互联网     背景:

通信世界网消息(CWW)2月16日,OpenAI(美国开放人工智能研究中心)推出了首个视频生成模型“Sora”。与Runway Gen2、Pika等AI视频工具仍在努力提升短时连贯性不同,Sora通过接收文本指令,能够生成清晰度为1080P、时长60秒的短视频,同时也可以对现有视频进行前后延伸。而一年前,同一研究团队发布的AI语言模型ChatGPT,已使得文本创作、撰写以及代码审查等工作变得极为便捷。

Sora作为一个基于深度学习的视频生成模型,采用了扩散型变换器架构,并使用大量的视频数据进行训练,其强大之处在于生成的视频可以包含精细的画面场景、生动的角色表情以及复杂的镜头运动。这意味着,继文本、图像之后,OpenAI将其先进的AI技术拓展到了视频领域。Sora是首个能够理解和模拟现实世界的视频生成模型,这一能力的实现是AGI(通用人工智能)的重要里程碑。

移动校园卡怎么激活

在OpenAI发布的Sora视频实例中,其中一个视频展示了“海盗船在咖啡杯中缠斗”的场景。为呈现出理想的视觉效果,Sora需克服多个物理难题,如咖啡杯与海盗船的相对尺寸、咖啡液体的流动性对船体运动的影响(包括波浪、水花等),以及光线和阴影的处理等。尽管在视频中船体运动过程的效果仍存在明显的瑕疵,但Sora似乎具备一定程度的“物理”理解能力。因此,有人认为Sora具有“世界模型”的特点,这使其在逼真度方面更具优势。

“世界模型”即对现实物理世界进行模拟,使人工智能能够类似人类,对世界形成全面且精确的认识,这将有助于AI视频生成更为流畅、逻辑更加严密。例如,咬一口饼干,饼干上会留下齿痕,这一逻辑对于人类而言是非常简单的;然而,要让AI模型理解前后两帧画面之间的逻辑关联却非常困难,它需从海量数据中学习并掌握生成语言、图像及视频的相应方法,从而生成“推理”结果。

事实上,当前的Sora也是如此,OpenAI在技术报告中公布了Sora的不成熟之处:Sora可能难以准确模拟复杂场景的物理原理,可能无法理解因果关系,可能混淆提示的空间细节,可能难以精确描述随着时间推移发生的事件,如遵循特定的相机轨迹等。笔者了解到,目前Sora对物理的理解是脆弱的,远非完美,仍会产生不符合常识的幻觉,还不能很好地掌握物体间的相互作用。

图灵奖得主杨立昆认为:“一个AI模型可以生成逼真的视频,这并不代表AI模型可以理解世界。”Sora目前的能力就像是人类做梦,虽然梦中场景很真实,但是逻辑上仍然存在一些问题。

尽管仍存在不少“Bug”,但不可否认的是,Sora的未来绝不仅是一款“人类造梦机”。360的创始人周鸿 表示,Sora的面世意味着实现AGI的时间将从10年缩短到一两年。在他看来,Sora只是小试牛刀,它展现的不仅是视频制作能力,更是大模型对真实世界有了理解和模拟之后的新成果和新突破。

可以预见的是,Sora将被最先应用于短视频、广告、互娱、影视、媒体等领域。在这些领域运用多模态大模型能力,辅助人类生成视频,不仅能大幅提高生产效率,还可以提供全新的视觉冲击,能够帮助企业真正实现降本增效、提升用户体验。

目前,Sora还未对公众开放,其性能和可靠性还需进一步提高,当然Sora可能带来的社会和伦理问题也需要解决。

如今,生成式AI产品正在潜移默化地改变我们的生活方式,每个人都在思考此类产品如何助力自身的生活与工作。当然,要全面打开生成式AI的想象力,还是要依托多模态大模型。Sora的发布以及后续科技巨头的持续跟进,有望为AI产业带来又一轮爆发式的增长。

华为5g领跑世界

gta6售出后gta5怎么办


返回网站首页

本文评论
支付宝“金秋消费节”发3亿红包  迎亚运庆双节助燃亚运经济_支付宝金秋优惠包
中秋、国庆“双节合一”,叠加亚运经济热潮,“十一”长假预计将迎来5年来最旺“黄金周”。9月22日起至10月8日,全国千万商家联合支付宝开启“金秋消费节”,2大举措助燃亚运经济,一...
日期:09-26
一加折叠屏手机价格「一加Open曝光:一加首款折叠屏旗舰」
快科技7月6日消息,据媒体爆料,一加首款折叠屏手机命名为OnePlus Open(以下简称一加Open)”。目前一加已在欧洲注册了OnePlus Open商标,新品会在今年下半年登场。据悉,一加Open采用...
日期:07-06
马斯克前女友抨击美国高房价:没有他爹帮忙 我孩子都没地方住「马斯克买的房子」
凤凰网科技讯 北京时间9月29日消息,马斯克的前女友、歌手格莱姆斯(Grimes)周三在推特上对美国得州的高房价进行了抨击。她表示,要是没有马斯克的帮忙,她都买不起房子。自从2020...
日期:10-01
Soul基于大语言模型推出智能对话机器人“AI苟蛋”,可与用户情感交流
7月6日消息,7月6日- 8日,第六届世界人工智能大会(WAIC 2023)在上海举办。大会现场,Soul App CEO特别助理施页楠介绍了Soul于2022年上线的智能对话机器人“AI苟蛋”,其能够与用户...
日期:07-06
AI癌症检测初创公司C2i Genomics与以色列顶级医院合作
本文概要:1.癌症检测初创公司 C2i Genomics 与特拉维夫 Sourasky 医疗中心合作,利用基于云的 AI 解决方案进行早期癌症检测。2. C2i Genomics 专注于全基因组微小残留病(MRD)检...
日期:08-21
朱雀二号遥二运载火箭发射圆满成功_朱雀二号火箭发动机
北京时间2023年7月12日9时00分,朱雀二号遥二运载火箭在我国酒泉卫星发射中心发射升空,按程序完成了飞行任务,发射任务获得圆满成功。此次任务是朱雀二号运载火箭第2次飞行。(静...
日期:07-12
比亚迪市值迟早超过特斯拉_比亚迪市值迟早超过特斯拉市值
作者|Eastland头图|视觉中国2023年3月29日,比亚迪(002594.SZ)公布了2022年年度报告,营收4240亿、同比增长96%;归母净利润166亿、同比增长445.9%;经营活动现金流净额1408亿、同比增长...
日期:04-04
广岛核爆真实视频「广岛核爆“幸存手表”拍出3.1万美元:时间停留在爆炸时刻」
快科技2月25日消息,据央视新闻报道,近日一块在1945年8月6日日本广岛原子弹爆炸中受损的手表,在拍卖会上以超过3.1万美元(约22万元人民币)的拍价成交。迅雷赚钱宝现在还赚钱总部位...
日期:02-25
公司年终奖老员工人手1个30克金牌 感谢忠诚引热议:网友问还招人吗?
近日,一则公司发年终奖老员工人手1个30克金牌”的消息引发网友关注。1月12日下午,浙江宁波,一公司忠诚奖”颁奖典礼现场,凡是工作满5年或10年的员工,无论职位高低,都会获得公司颁...
日期:01-14
世界计算机大会_2019世界计算机大会报名通道正式开启
凝聚全球智慧 研判发展趋势 共商发展大计 9月9日-11日,湖南长沙 2019世界计算机大会盛世空前 一场主论坛! 九场专题论坛! 一个创新技术和产品应用成果展! 计算机生态、计算...
日期:12-01
刘畊宏20秒短视频要价60万 有人认为这个价格不值「刘畊宏 演讲」
6月3日 消息:一年一度的618购物狂欢节已经拉开帷幕,各家电商平台和商家都在加紧推销,而明星、网红带货则是最受欢迎的方式之一。比如京东推出了直播带货的服务并与交个朋友合...
日期:06-03
谷歌医疗版 ChatGPT 已在诊所实测!可生成诊断做总结,多个指标和真人医生相当
7月11日 消息:《华尔街日报》报道,谷歌的医疗大模型 Med-PaLM2在对外发布前已在多家诊所内测试。Med-PaLM2是基于谷歌最先进的大语言模型 PaLM2开发的,通过大量医疗数据训练,是...
日期:07-11
亚马逊二季度业绩超预期 周五股价大涨超10%_亚马逊第四季度财报
查看最新行情   讯;北京时间7月30日凌晨消息,周五收盘,亚马逊股价大涨10.36%,报134.95美元。 5g旗舰机对比哈药集团事件滴滴出行战略分析ipad市场调研五...
日期:07-31
技术赋能产业 伊对深耕恋爱社交领域
  随着互联网社交时代的到来,新技术不断赋能在线社交,产生越来越多的细分领域和创新玩法。恋爱社交就是近几年崛起的一个社交品类,而开辟这个赛道的正是视频恋爱社交平台伊...
日期:04-11
iphone闪电接口怎么用「消息称闪电接口的 iPhone 15 机型研发 2 个月即遭放弃」
IT之家 4 月 19 日消息,可靠消息源 Unknownz21 在最新推文中透露,苹果于 2022 年 1 月开始测试采用 Lightning 端口的 iPhone 15 机型,不过该原型迅速被苹果放弃。中国抗癌协会...
日期:04-19
周鸿祎晒清华博士录取通知书 被录取为博士_清华大学周倜
周鸿祎在微博上晒出了清华大学的录取通知书,写道“终于实现了梦想,希望360智脑助我顺利毕业。”通知书显示,周鸿祎被清华大学计算机科学与技术系电子信息专业录取,将攻读非全日...
日期:06-28
社交游戏商Zynga收购社交浏览器开发商Flock(社交游戏开发商Zynga的首席执行官)
  北京时间1月8日消息,据国外媒体报道,社交游戏厂商Zynga周四宣布,它将收购社交网络浏览器开发商Flock。这是Zynga在最近几个月来进行的第8宗收购交易。   Flock首席执行...
日期:07-25
AMD 12nm翻新版R5 1600测试:加速频率提升/功耗更低,约600元_AMD r5 1600
  12月22日消息 昨天,Tom's Hardware报道称,初代AMD 6核 Ryzen 5 1600原来采用格罗方德14nm工艺,现更以12nm呈现。现在,一名Reddit用户称最近收到了Ryzen 5 1600的AF版本,并做...
日期:12-06
微信收藏在哪里_新浪首推微收藏功能 开创收藏新领域
  新浪微博是2011年最火热的词语之一,集万千宠爱于一身的同时,也有2亿的眼睛在盯着微博的一举一动,如何利用这个平台创造更好的产品,从而更好的为2亿用户服务,稳固国内微博的...
日期:07-22
知识产权保护给华为P60」,Pro影像升级提供助力 「创新成果沿途下蛋
7月13日,在深圳华为总部G区旗舰店,华为举办2023创新与知识产权(IPR)论坛。对于此次创新与知识产权保护论坛,华为以开放、合作、共赢的理念,促进专利和技术的合理保护和共享,从而推...
日期:09-09