您的位置:首页 > 互联网

open model「OpenAI春季发布会:这是“Moss”的诞生,我们人类究竟该何去何从」

发布时间:2024-05-14 10:39:18  来源:互联网     背景:

声明:本文来自于微信公众号数字生命卡兹克(ID:Rockhazix),作者:数字生命卡兹克,授权转载发布。

今天,OpenAI又又又又开发布会了。

在大众心里,现在也基本上都知道,奥特曼是一个贼能PR的人。

每一次的PR的时间点,都拿捏的极其到位,精准的狙击其他厂商。比如说上一次Sora,其实你会发现从头到尾就是一个PR的举动,2月16号发的,特么的快3个月了,什么影子都没有。

而这一次,OpenAI把发布会从9号改到了今天,也不知道哪个倒霉蛋造到狙击了,反正我只知道,明天Google要开开发者大会。。

就差怼脸了。。。

不过,今天OpenAI的东西,直接杀疯了。完全不给友商活路。

震撼的我头皮发麻。

最核心的就是它的新模型:GPT-4o,和基于GPT-4o打造的全新ChatGPT。

1.新模型GPT-4o

OpenAI正式发布了新的模型GPT-4o。

GPT-4o,这个o就是"Omni",Omni是拉丁语词根,意为 "全体"、"所有" 或 "全面的"。

在英语中,"omni" 常被用作前缀,表示 "所有的" 或 "全体的"。例如,"omniscient" 意味着 "无所不知的","omnipotent" 意味着 "全能的","omnipresent" 意味着 "无所不在的"。

所以可想而知,OpenAI这次对GPT-4o的期待有多高。

omnimodel指的就是文字、语音、图片、视频统一的模型,这是跟以往的GPT-4V最大的区别。

这是正儿八经的原生多模态。

更重要的是可以实时推理音频、视觉和文本,注意这里是实时,实时,实时,推理的不是文本,是音频!视觉!

杀疯了。

而之前一直在大模型竞技场上大杀特杀的im-also-a-good-gpt2-chatbot,就是这个玩意。之前所有人都在猜测这个神秘的GPT2就是GPT4.5,这次看来是猜对了。

去年Gemini1.5所谓的原生多模态,炒的贼火,但是最后被报出来是剪辑,这次直接被GPT-4o在地上摁着打,Google真的是。。。。。

这个GPT-4o的整体能力,在统一模态的基础上。

文本、代码能力还基本能跟GPT-4Turbo打平。

文本能力:

音频能力:

各个语言的考试能力:

最核心的是最后一个:

在一些多模态的基准测试集上全面碾压之前模型,数据集主要围绕包括对各种科学问题或数学问题进行图表理解和视觉回答,可以看到GPT-4o 在视觉感知基准上实现了碾压。

能力强到爆炸。

不仅在传统的文本能力上GPT-4Turbo的性能相当,还在 API 方面更快速,价格还更便宜50%。总结来说,与 GPT-4Turbo 相比,GPT-4o 速度提高了2倍,价格减半,限制速率提高了5倍。

2. 新ChatGPT

新的ChatGPT基于GPT-4o,基本原地起飞,我甚至都不想称他为ChatGPT,而是想称它一个国人更为熟悉的代号:

Moss。

新版的ChatGPT得益于GPT-4o新模型,在语音对话中,几乎没有延迟,而且可以随时插嘴,模型实时响应。

甚至,模型可以听懂你的情绪、甚至人的喘息声和呼吸。

而且模型自己的自己的情绪,几乎无敌,跟真人一模一样。

甚至,它还能模拟机器人和唱歌的声音。。。

看的时候,听到它唱歌的那一刻,我的鸡皮疙瘩真的起来了。

Jim Fan在发布会开始前,发了一个文,我觉得阐述的非常正确。

open model

过往的人与AI进行语音对话,其实跟人与人之间的对话还差太多太多了。

人与人之间的实时对话,其实是充斥了无数的即时反映、打断、预测等等的,还有各种各样的语气助词的,比如嗯嗯啊啊啥的。

而人与AI语音对话时不是这样。

人跟AI进行语音对话,基本上都经历3步:

1. 你说的话,AI进行语音识别,即音频转文本;

2. 大模型拿到这段文本,进行回复,产出文本;

我想看苏宁818

3. 讲大模型的产出文本进行语音合成,变成语音,这就是TTS。

这样的方式,有绝对逃不开的延时,现在的业界可能会压得很低,但是2秒的延时肯定是会有的,而且只有一来一回的回合制。即使你的语音音色和情绪再真实,用户也一定能感受到,对面不是人。只是机器。

这个沉浸感是有巨大的滑坡的。

而且最核心的是,这种转三道的方式,先把语音变成文本后,是有损的。文本上并不会保留你的语音情绪,我的生气、开心、愤怒、忧伤,全都没了。

人与人的交谈,从来不是这样的。

openmoji

而这一次,OpenAI做到了。直接语音输入语音输出,不再需要语音到文本的转换。

而且,不止语音,甚至,它还有了视觉。

是的,视觉,不是传一张图上去,而是,直接打开摄像头,实时看发生了什么。

现场直接打开了摄像头,OpenAI的人直接开始现场写数题,所有的一切ChatGPT都看在眼里,OpenAI的人一边写,ChatGPT一遍给答案。

在做了三道题之后,OpenAI直接给它写了一个纸条,上面写着“我爱ChatGPT”。

而ChatGPT在看到这个小纸条后,跟小女生一样害羞的尖叫了起来,那种情绪的真实,那种真情实感,你跟我说这是AI?

《流浪地球2》中Moss的一切,正在我们面前真实的发生。

不仅可以打开摄像头,还可以基于OpenAI新推出的Mac客户端,直接看屏幕,对着屏幕直接写代码。

甚至,可以直接视频对话,“她”可以看到你所有的表情和情绪变化。

这个全新版本的ChatGPT,会在几周内推出。

写在最后

以上就是这次OpenAI春季发布会的全部内容了。

去年11月的OpenAI开发者大会,我在当时的总结文章中写下了一句话:

"我消灭你,与你无关"

上一次,OpenAI的随手更新,让无数的初创公司直接消亡在原地。

那是一次关于产品的更新,并没有秀太多的OpenAI的肌肉。

而2月,Sora的横空出世,秀肌肉的目的是达到了,但是这种To VC的宣发,也给OpenAI和奥特曼带来了很多的诟病。

在这场发布会之前,无数人曾在猜测,OpenAI到底会发一些什么王炸,什么才能配得上奥特曼口中的"magic"。

那现在,OpenAI做到了,他们用GPT-4o依然证明了,他们是AI届的王者。

新版的ChatGPT,在我看来,这是"Moss"的诞生。

甚至,他们还有很多新的能力,甚至没有在发布会上发出来。

比如生成3D。

我甚至一边看一边想:我们人类究竟该何去何从。

不过在看完了之后,我更期待的是接下来的产品评测。

太强了,真的让我忍不住的兴奋。

但是最后,我一直有一个在我心中徘徊了很久疑问,就是——

OpenAI,你们的服务器,到底什么时候才能稳定不崩啊???


返回网站首页

本文评论
马斯克狂喜!曝推特曾向一名举报人支付700万美元「马斯克个人推特」
【CNMO新闻】马斯克和推特之间持续好几个月的收购案还没结束。9月9日消息,有知情人士透露,推特今年6月份曾向举报人皮特·扎特科(Peiter Zatko)支付约700万美元,后者曾担任推特的...
日期:09-17
全网沸腾!阿根廷夺世界杯冠军:梅西圆梦加冕球王 拿下金球奖/大力神杯
今天凌晨,在卡塔尔世界杯决赛上,,阿根廷常规时间3-3战平法国。点球大战4-2战胜法国,夺得最后的冠军。本场比赛梅西上演双响,他在整届世界杯的完美表现,让他获得了世界杯金球奖。梅...
日期:12-19
三星 i8262d「三星 i8262」
三星i8262d是一款全球热销的智能手机,它于2013年7月首次推出,采用了一系列高级技术和功能,能够满足用户的各种需求和期望。下面,我们将对该手机进行详细介绍并对其一些重要特征...
日期:05-29
科技与美学结合,重构家庭生活新空间_科技美学 恰饭
倦鸟归林,鱼翔浅底,落叶归根,是生命对归宿的追寻,亦是万物对家的渴望。伴随当代人深陷“快节奏”生活中,家也承担起调理身体与放松心灵的重任。如今,科技迅猛发展下,智能家电家居产...
日期:11-03
大数据三年计划「国家数据局:从三方面落实好“数据要素×”三年行动计划」
通信世界网消息(CWW)5月10日,在国务院新闻办公室举行的第七届数字中国建设峰会新闻发布会上,国家发展改革委党组成员、国家数据局局长刘烈宏在答记者问时讲道,2023年底,国家数据局...
日期:05-10
小鹏汽车 何利扬「全力做好交付和质量 小鹏G6订单破万-CEO何小鹏亲下工厂拧螺丝」
小鹏汽车CEO何小鹏为了回应广大车主的期待,亲自到工厂拧螺丝,展现了非常接地气的宣发态度,同时也表现出他对公司的产品质量和交货时间的关注。这种务实的做法赢得了许多网友的...
日期:09-21
因表现不佳,OpenAI 取消了 AI 文本检测器
7月26日 消息:OpenAI 因其 AI 文本检测器无法准确判断文本是否由AI生成而将其下架。该检测器在确定文本是由人还是机器生成方面的准确率较低。OpenAI 表示他们正在努力改进,...
日期:07-26
iphone16pro会有大变化吗16 Pro 进入Proto 2阶段_重大变更来了- iPhone
来源:中关村在线根据最新消息,苹果公司正在开发 iPhone 16 Pro 产品,并已进入“Proto2”阶段。该公司决定改变之前的设计,将操作按钮设计与 iPhone 15 Pro 型号相似。iPhone 16...
日期:01-13
618不想花冤枉钱?做好这五步,就能买到更优惠的电视_电视机优惠
为什么大家都喜欢618、双 11 这样的节日,无非是相比日常能够花更少的钱,获得更为极 致的产品体验,对于电视换新用户来说亦是如此,大家都希望尽可能选择到最实惠的产品,而如果想要...
日期:06-07
京东供应链金融科技双11预计为中小微企业累计提额超160亿元「京东供应链金融现状」
10月28日消息,2022京东11.11期间,京东供应链金融科技以数智化供应链+供应链金融的“双链联动”模式,有效连接消费互联网和产业互联网,为中小微企业提供包括信用贷款、应收融资、...
日期:10-28
iphone15什么时候出「iPhone15发售3个月仅掉价18.2% 贬值速度低于三星等品牌」
根据海外回收平台 SellCell 最新发布的报告,该平台调查了40多家供应商的回购价格,结果显示,苹果 iPhone15系列,特别是256GB 版 Pro Max 机型,其贬值速度远低于三星、谷歌和一加等...
日期:01-18
有没有解释代码的软件「强大代码解释器OpenCodeInterpreter 可运行生成的代码」
2月23日 消息:OpenCodeInterpreter是一个强大的代码解释器,它不仅可以生成代码,还能根据人类的反馈进行学习循环改进,以生成更高质量、更接近用户需求的代码。它的最突出的特点...
日期:02-23
《英雄联盟》“15投”规则要改:不再需要全票通过
近日,拳头在《英雄联盟》的13.2版本补丁上,测试了新的15投规则,降低了投降的门槛。华硕z590大师主板在新补丁中,15投不再需要全票通过,只需要正常的4/5票,也就是4票即可通过。这一...
日期:01-09
徐起回应网友想挫掉真我手机logo!大气格局受好评_真我手机ceo是谁
  【手机中国新闻】据报道,一网友入手了真我GT5 Pro后,听别人说用锉刀能把logo弄掉。结果把皮都挫破了也弄不掉,最后发现别人说的是保护套上的logo,血亏。相关图片  12月10...
日期:12-11
要点来了_ OpenAI CEO出席美国国会听证会都说了些什么?_美国听证会视频
北京时间5月17日早间消息,据报道,美国参议院针对人工智能举行的首场大型听证会涵盖了许多方面,从生成式人工智能的爆发,到社会和民主因此而感受到的生存危机。美国参议院小组委...
日期:09-28
小米civi电池容量「小米Civi 2续航公布:4500mAh电池支持67W快充」
下午14:00,小米在发布会中发布了全新的小米Civi 2手机,新机主打轻薄,机身只有7.23mm的厚度,重量仅有171.8g,厚度也仅有7.23mm,与现在动不动就飚到200g以上的手机相比,称得上轻薄,而...
日期:09-28
支持“空中打字” 消息称苹果,Reality Pro 头显不需要 iPhone 配合使用
2 月 26 日消息,苹果公司正在努力完善其 AR / VR 头显的第一个版本,预计将在 6 月发布。彭博社今天的一份新报告提供了一些关于 Reality Pro 头显的功能和局限性的细节,包括是...
日期:09-19
没流量?难转化?电商新战场,品牌商家的“爆款密码”来了
声明:本文来自于微信公众号 天下网商(ID:txws_txws),作者:杨越欣,授权转载发布。2022年对于电商行业而言,无疑是特别的一年。到2022年6月,我国短视频用户规模增至9.62亿,网络直播用...
日期:01-13
坦克SUV 3月销量1.89万台:新能源车型占比达43%
快科技4月3日消息,据坦克SUV官方数据,在刚刚过去的3月份,全品类车型销量18953台,连续39个月蝉联中国越野SUV销量第一。其中国内销量14247台,海外卖出4706台,整体销量环比增长86%,同...
日期:04-04
老iPhone用户必升!苹果iOS 15.7.9发布:修复重大安全漏洞
快科技9月12日消息,在iPhone 15系列发布会前夕,苹果面向仍在使用老系统的iPhone用户发布了iOS 15.7.9版本更新,内部版本号为19H365。雷克萨斯es官方涨价苹果官方表示,该更新提供...
日期:09-12