您的位置:首页 > 互联网

GPT-5降临,代号猎户座?OpenAI疑用草莓训练,数学推理暴涨超越所有模型

发布时间:2024-08-28 22:41:14  来源:互联网     背景:

声明:本文来自于微信公众号 新智元,作者:新智元,授权转载发布。

OpenAI的下一代旗舰大语言模型,要来了?

据悉,新模型代号Orion(猎户座),就是能超越GPT-4的下一代模型。

在小区安充电桩 如何与物业过大招儿

而猎户座的预训练数据,正是由草莓模型生成的。

而草莓模型驱动的聊天机器人,很可能就会在今年秋天上线!

关于OpenAI的草莓,外媒The Information最近又挖到了新的细节。

根据The Information的信息,网友推测:GPT-4+草莓会在秋季推出,之后上线的继任者猎户座可能就是GPT-5。

由于大概率要避开11月,因此,猎户座的发布时间要么在之前要么是在12月。

甚至,AI大V、Hallid.ai联创indigo提出了一个大胆的猜测:猎户座或许不是GPT-5,而是GPT-6。

AI大VChubby表示附议。

最后,Chubby激动地表示:所有人都觉得AI的发展正在放缓?并不是。在大公司,厨房里的东西正在沸腾!

网友们纷纷表示:我们正在见证一种超越我们自己思想的诞生。

打开Q*之门,一切模型凭此迭代。

有人担心,如果GPT-5控制整个互联网,人类会从此迷失。

所以,猎户座到底是GPT-5还是GPT-6呢?网友们各持己见。

但有人猜测,我们目前还没有足够的算力来达到GPT-5,更不用说GPT-6了。

透个底,让美国政府安心

此前,关于草莓的传闻早已满天飞。

今年夏天,Sam Altman的团队已经向美国国家安全官员展示了这项技术。

在安全问题日益敏感的情况下,OpenAI的做法也算给大家打了个样。

如果政府官员觉得这项AI不安全怎么办?那就给他们展示一下。

这次演示,就是OpenAI让政策制定者觉得更透明的努力的一部分。毕竟,如果他们感觉到受到这项技术的威胁了,很可能就会给公司带来麻烦。

现在,OpenAI的安全团队已经出走,愤怒的前员工在网上大肆爆料,这种时候,对政府官员更加透明的做法,就显得尤为重要。

The Information表示,这次演示还可能另有目的:跟政府队员就如何保护技术进行对话,以防止美国的AI技术被他国窃取。

说不定,还可以借此机会攻击Meta一波,因为他们的AI是开放权重的,其他国家想要获取,是非常容易的事。

总之,未来几年内,AI开发者应该会经常出现在旧金山和华盛顿之间的航线上了,因为他们时不时就需要跟政府官员来往一下。

草莓:数学提升,能解字谜

一个月前路透社曾报道,OpenAI内部测试了一种AI,在MATH基准上得分超过了90%。

据猜测,这个模型很可能就是草莓。

如今的传言是,今年秋天OpenAI研究者会推出代号为草莓的新AI(也就是之前的Q*),或许会聊天到ChatGPT之类的聊天机器人中。

它能做到目前的聊天机器人无法做到的很多事情,比如解决未曾遇到的数学问题,还能解决编程难题。

在获得额外思考时间后,草莓模型还可以回答更主观的问题,比如产品的营销策略。

据悉,在语言任务上,草莓表现出了强大的能力。比如OpenAI的一位员工曾向同事演示了草莓成功解决《纽约时报》的Connections——复杂的文字谜题。

OpenAI在LLM和会话AI领域的领先地位,一直在遭受冲击,因此OpenAI只能对外不时放出点草莓的消息,提升一下自己的存在感。

另外,据说草莓的技术已经显示出了智能体的能力。

草莓模型似乎能够自主浏览网络,像人类研究人员一样,独立上网、进行深度研究。

它不仅能生成答案,还能规划、执行一系列复杂任务,还能收集信息。

与之类似的,还有斯坦福的Quiet-STaR。

就像人类会在说话或写作前会停下来思考自己的想法一样,Quiet-STaR可以训练LLM去生成在复杂推理问题中采取步骤的内部思考,从而做出更好的决策。

华硕路由器ax86u值得购买吗

论文地址:https://arxiv.org/abs/2403.09629

眼下,OpenAI的业务正以惊人的速度增长:跟去年相比,今年它向企业销售LLM和ChatGPT订阅的收入大约增加了三倍,达到了每月2.83亿美元,尽管公司每月的亏损可能高于此。

目前,OpenAI的私人估值为860亿美元。

Sam Altman还希望为公司筹集更多资金,找到减少损失的方法。

自2019年以来,OpenAI已经从微软筹集了约130亿美元,与这家企业软件巨头的协议,会持续到2030年。

合作条款可能会发生变化,包括OpenAI向微软支付租用云服务器以开发AI的方式。

云服务器,是OpenAI最大的成本。

OpenAI的新希望:Orion(猎户座)

但说到底,OpenAI的前景终究还是依赖正在开发的新旗舰——Orion。

有人能解释一下为什么OpenAI、谷歌和亚马逊一直用希腊神话来命名他们的模型吗?

去年初推出后,GPT-4已经被各家赶超得差不多了,现在GPT-4级的模型,可以说是各家人手一个。

金融科技的监管与创新已步入

有人猜,OpenAI可能会推出一个比原始草莓模型更小、更简化的模型,也就是蒸馏版。

这个版本被寄望于提升GPT-4和ChatGPT性能,目的是保持和更大模型相同的性能水平,而且更易于操作,成本更低。

另外,还有知情人士透露,OpenAI还在用更大的草莓版本,为Orion的训练生成数据。

这种人工合成数据,意味着草莓能帮助OpenAI克服获取高质量数据的限制,从而可以从现实世界数据(比如从互联网获取的文本或图像)中训练新模型。

研究人员表示,使用草莓可以帮助Orion减少幻觉的产生。

这是因为,AI模型是从训练数据中学习的,所以它们看到的复杂推理的正确示例越多,就越好。

对此,智能体初创公司Minion AI的CEO兼GitHub C o p i l o t前首席架构师Alex Graveley给予了高度厚望。

想象一个没有幻觉的模型,一个你问它逻辑难题、它第一次就答对了的模型。

训练数据中存在较少的歧义,因此它的猜测更少。

The Information猜测,草莓改进的推理能力,可能会整合到ChatGPT中。这些答案可能会更准确,但也可能更慢。

因此,草莓可能并不适合需要即时即时响应的应用。而在GitHub中修复非关键编码错误,则是理想的选择。

或许,以后的ChatGPT用户,可以根据请求的时间敏感性来切换草莓模型。

Sam Altman在五月的一次活动中曾表示:我们感觉,为下一个模型准备的数据已经足够。

这个模型,很可能指的是就Orion。Altman表示:我们进行了各种实验,包括生成合成数据。

解决复杂数学问题:有前景的应用

如果说目前AI最有前景的应用,那解决复杂数学问题,必然是其中一个了。

毕竟,现有的AI在数学密集的领域如航空航天和结构工程中,表现实在不佳。

各种LLM在回答数学问题时,往往会给出各种让人啼笑皆非的答案。

而且,数学推理能力的提升还能帮助AI模型更好地推理会话查询,比如用户的服务请求。

谷歌和一些初创公司,也在这方面发力。

上个月,谷歌DeepMind开发的AI,已经能在国际数学奥林匹克竞赛中击败大多数人类参赛者。

广东顺德光晟电器股份有限公司电话

OpenAI的另一大竞争对手Anthropic祭出的最新模型,也能编写更复杂的软件代码,还能回答有关图表和图形的问题,这些都要归功于它推理能力的改进。

还有一些初创公司为了提高模型的推理能力,采用了一种廉价的技巧,将问题分解为更小的步骤,尽管这些方法速度慢且成本高昂。

无论Strawberry是否会作为产品推出,人们对Orion的期望都不会低了,因为OpenAI会力求继续保持领先地位,同时还要保证显著的的收入增长。

OpenAI的领先者优势,已经不明显了。

虽然在5月宣布了Her的版本,但谷歌却抢先推出了AI驱动的语音助手,后者也足够灵活,还能处理用户的打断,和突然变化的话题。

而Lmsys Chatbot Arena等大模型排行榜上,谷歌、xAI、Anthropic和Meta的模型也都在赶上OpenAI的步伐。

Ilya看到了什么?

值得一提的是,草莓之父,其实就是已经离职了的OpenAI的首席科学家Ilya Sutskever。

几年前,Ilya启动了一个项目,在研究过程中,诞生了草莓。

而在Ilya离职之前,OpenAI的研究人员Jakub Pachocki和Szymon Sidor,就已经在Ilya的工作基础上开发了一个新的数学求解模型Q*,这让不少关注AI安全的研究人员感到担忧。

另外,在去年Q*的前期准备中,OpenAI研究人员开发了一种被称为测试时计算的概念变体,目的是提升LLM的问题解决能力。

这样,LLM就会花更多时间考虑被要求执行的命令,或问题的各个部分。

当时,Ilya发表了一篇与这项工作相关的博客。

博客地址:https://openai.com/index/improving-mathematical-reasoning-with-process-supervision/

在博客中,模型解决了数个有难度的数学问题。

比如在这道有挑战性的三角函数题中,需要连续应用几个并不明显的等式。

在这道题,GPT-4成功执行了一系列复杂的多项式分解。

步骤5中使用的Sophie-Germain恒等式是重要的一步,可以被认为极有洞察力。

在这道题的步骤7和8中,GPT-4开始执行猜测和检查。

这也是模型可能产生幻觉的常见情况,LLM会声称某个特定的猜测是成功的,但实际上并不成功。

在这种情况下,奖励模型会验证每个步骤,并确定思路是否正确。

在最后这道题中,模型成功地应用了多个三角恒等式,来简化了表达式。

或许,我们能从中窥见草莓和Orion的端倪。

参考资料:

https://www.theinformation.com/articles/openai-races-to-launch-strawberry-reasoning-ai-to-boost-chatbot-business?rc=epv9gi

https://www.theinformation.com/articles/openai-shows-strawberry-ai-to-the-feds-and-uses-it-to-develop-orion?rc=epv9gi


返回网站首页

本文评论
开店做淘宝「不就是开个淘宝店嘛?店搭子、AI都来了」
声明:本文来自于微信公众号 半佛仙人(ID:banfoSB),作者:xxxxx,授权转载发布。詹姆斯获得得分王1前段时间有个非常魔幻的新闻,说三个人想创业,合伙开了个汉堡店,结果日营业额才79块...
日期:05-01
2020款联想_联想发布2020年10大技术预测
  ​作者:联想集团总裁兼首席运营官蒋凡可·兰奇     技术预测1:2020年将成为5G之年   5G的速度可高达10G/秒,是4G的100倍。我们很难概括出5G技术将带来的所有变化并...
日期:02-08
新闻集团准备割肉价卖出社交网站myspace
  北京时间4月27日消息,据国外媒体报道,新闻集团(News Corp)正在为MySpace寻求不低于1亿美元的出价,数家私募股权公司预计将在本周末提交收购出价。   据“熟悉此次交易的人...
日期:07-27
FPGA首发支持PCIe 5.0和CXL 2.0 领先AMD_Intel
Intel昨日发布首款支持PCIe 5.0和CXL功能的Agilex 7 FPGA R-Tile,现正批量交付中。据悉,Agilex 7 R-Tile FPGA(现场可编程门阵列)采用Intel 10nm SuperFin工艺制造,小芯片设计,基...
日期:09-27
Pro进入“准备发货”状态 首批2024款苹果iPad_ipad pro2021暂未发售
【】5月13日消息,上周苹果发布了史上最强的新iPad Pro,首发M4芯片,售价8999元起。近日有用户反馈称,目前首发批次的订单已经进入准备发货状态,将会在5月15日开售当天送到首批用户...
日期:05-13
走出趣布局西南 助力重庆跨境人力市场迎生机
  跨境人力资源行业根植于国内几十年以来的传统出国劳务市场,受地域社会经济环境和各地政策等因素的影响,不同区域的跨境人力资源行业发展呈现出不均衡的现象。比如江苏、...
日期:06-28
苹果116倍变焦「郭明錤:苹果 iPhone 16 Pro/Max 都将配备 5 倍光学变焦镜头」
IT之家 9 月 19 日消息,苹果分析师郭明錤表示,虽然目前 iPhone 15 Pro Max 独占 5 倍光学变焦的长焦镜头,但明年的 iPhone 16 Pro 和 iPhone 16 Pro Max 都将具备这一功能。他...
日期:09-19
低俗!两主播为博眼球直播活吞牛蛙被行拘_吃播吃牛蛙的视频
快科技8月16日消息,据南昌公安公众号通报,近期,安义县公安局网安大队在工作中发现低俗直播情况,目前已经依法处理。魅族18黄章据介绍,这两名本地网络主播在某网络平台上,直播相互...
日期:08-16
小米新款折叠屏手机官宣7月上市 小米新款小折叠手机官宣在即
来源:中关村在线立冬这一天天气暖和近年来,折叠屏手机迅速发展,各大厂商纷纷推出各自的折叠屏机型。其中,荣耀和小米是典型代表,他们推出了横向折叠和纵向折叠方案的手机。近日,小...
日期:06-14
《咬文嚼字》发布2022年十大流行语 摆烂、栓Q落选「咬文嚼字编辑部2020年十大流行语」
12月26日 消息:刚刚,2022《咬文嚼字》十大流行语公布,“踔厉奋发、勇毅前行”“天花板”“沉浸式”“中国式现代化”“新赛道“”大白“”烟火气“”拿捏”“雪糕刺客”“精神...
日期:12-26
微软发布下一代「微软CEO预测新一代AI电脑将激发PC与Mac新一轮竞争」
通信世界网消息(CWW)微软公司首席执行官萨蒂亚·纳德拉近日表示,他相信配备专用人工智能芯片并拥有更快性能的新一代计算机,将重新点燃Windows PC与苹果公司Mac之间的长期竞争火...
日期:05-23
ios16.6「苹果iOS 16.5.1正式版发布 建议升级!」
今天凌晨苹果发布iOS 16.5.1正式版,和上次相隔34天,iOS 16.5.1更新提供了重要安全性修复,苹果建议所有用户安装。realme10x是什么处理器草莓引起发烧iOS 16.5.1修复了无法通过...
日期:06-24
魅族首款AR智能眼镜正式官宣:只需支付1元即可参与盲订优惠
快科技10月30日消息,今天魅族终于官宣了上周预热的神秘新品魅族AR智能眼镜。这也是魅族首款AR智能眼镜产品,是星纪魅族集团在XR领域倾心打造的重磅产品,基于创新显示技术,打造出...
日期:10-30
疯狂小杨哥回应电商挤压实体经济:实体不会陨落 电商让线下变得越来越好
快科技10月24日消息,日前,针对电商电商挤压实体经济这一观点时,疯狂小杨哥在直播间表示,实体不会陨落,不可能的。如果今天没有电商,只能在线下买东西,那这个东西会有多贵。”小米哪...
日期:10-24
美国三大股指上周涨跌「美股周二:三大股指全线上涨,百度涨逾12%,知乎上涨31%」
美国时间周二,美股收盘主要股指全线大幅上涨,科技股领涨。美联储主席鲍威尔表示,预计2023年美国通胀将大幅下降,但有必要进一步加息。道琼斯指数收于34156.69点,上涨265.67点,涨幅...
日期:02-10
12代酷睿源码泄露 Intel:安全没问题 找到漏洞还有奖「十代酷睿漏洞」
日前Intel的12代酷睿处理器BIOS源码泄露引发网络热议,网上信息显示文件容量高达6GB,主要用于创建及优化12代酷睿的UEFI BIOS。考虑到BIOS的重要性,这次泄露引发了很多人担心,不...
日期:10-12
苹果市值蒸发5451亿元「苹果市值一夜蒸发7660亿元 分析师称iPhone15销售低迷」
2024年1月2日(当地时间),美国股市开年首日交易,三大指数表现分化。收盘时,道琼斯指数微涨0.07%,纳斯达克指数大跌1.63%,标准普尔500指数下跌0.57%。苹果股票在2024年首个交易日遭遇...
日期:01-03
百度:已将大语言模型应用于搜索、图表制作等领域
8月17日 消息:8月16日,由深度学习技术及应用国家工程研究中心主办的 WAVE SUMMIT 深度学习开发者大会2023在北京举行。百度首席技术官王海峰在深度学习开发者大会上表示,大语...
日期:08-17
比亚迪预计前三季度净利超200亿_比亚迪前三季度财报
手机不用也会耗电到关机到底是为什么雷递网 乐天 10月17日比亚迪股份有限公司(证券代码:002594,证券简称:比亚迪)今日发布业绩预告。比亚迪预计2023年前三季度归属于上市公司股东...
日期:10-18
杯具!男子试驾新摩托车意外身亡 撞到马路边:网友感慨速度有多快
近日,河北张家口一男子试驾新摩托车时发生意外。据悉,该男子试驾的是凯越机车(西藏新珠峰摩托车有限公司旗下注册品牌),其适合那些预算比较低,买摩托车更多的是用于日常代步的用户...
日期:08-22