您的位置:首页 > 互联网

OpenAI神秘新模型Q*曝光,太强大让董事会警惕,或是奥特曼被开除导火索

发布时间:2023-11-25 02:28:03  来源:互联网     背景:

梦晨 发自 凹非寺

量子位 | 公众号 QbitAI

OpenAI宫斗大戏刚刚落幕,马上又掀起另一场轩然大波!

路透社曝光,在奥特曼被解雇之前,几位研究人员给董事会写的警告信可能是整个事件导火索:

内部名为Q(发音为Q-Star)*的下一代AI模型,过于强大和先进,可能会威胁人类。

Q*正是由这场风暴的中心人物,首席科学家Ilya Sutskever主导。

人们迅速把奥特曼此前在APEC峰会上的发言联系在了一起:

OpenAI历史上已经有过四次,最近一次就是在过去几周,当我们推开无知之幕并抵达探索发现的前沿时,我就在房间里,这是职业生涯中的最高荣誉。”

Q*可能有以下几个核心特性,被认为是通往AGI或超级智能的关键一步。

突破了人类数据的限制,可以自己生产巨量训练数据 有自主学习和自我改进的能力

3099元起售索尼ps5国行正式发布

这则消息迅速引发了巨大讨论,马斯克也带着链接来追问。

最新的梗图则是,好像一夜之间,人们都从研究奥特曼和OpenAI董事会的专家,变成了Q*专家。

突破数据限制

根据来自The Information的最新消息,Q*的前身是GPT-Zero,这个项目由Ilya Sutskever发起,名字致敬了DeepMind的Alpha-Zero。

Alpha-Zero无需学习人类棋谱,通过自己跟自己博弈来掌握下围棋。

GPT-Zero让下一代AI模型不用依赖互联网上抓取的文本或图片等真实世界数据,而是使用合成数据训练。

2021年,GPT-Zero正式立项,此后并未有太多直接相关的消息传出。

但就在几周前,Ilya在一次访谈中提到:

不谈太多细节,我只想说数据限制是可以被克服的,进步仍将继续。

在GPT-Zero的基础上,由Jakub Pachocki和Szymon Sidor开发出了Q*。

两人都是OpenAI早期成员,也都是第一批宣布要跟着奥特曼去微软的成员。

Jakub Pachocki上个月刚刚晋升研究总监,过去很多突破包括Dota 2项目和GPT-4的预训练,他都是核心贡献者。

Szymon Sidor同样参与过Dota 2项目,个人简介是“正在造AGI,一行代码接一行代码”。

在路透社的消息中,提到给Q*提供庞大的计算资源,能够解决某些数学问题。虽然目前数学能力仅达到小学水平,但让研究者对未来的成功非常乐观。

另外还提到了OpenAI成立了“AI科学家”新团队,由早期的“Code Gen”和“Math Gen”两个团队合并而来,正在探索优化提高AI的推理能力,并最终开展科学探索。

三种猜测

关于Q*到底是什么没有更具体的消息传出,但一些人从名字猜测可能与Q-Learning有关。

Q-Learning可以追溯到1989年,是一种无模型强化学习算法,不需要对环境建模,即使对带有随机因素的转移函数或者奖励函数也无需特别改动就可以适应。

与其他强化学习算法相比,Q-Learning专注于学习每个状态-行动对的价值,以决定哪个动作在长期会带来最大的回报,而不是直接学习行动策略本身。

第二种猜测是与OpenAI在5月发布的通过“过程监督”而不是“结果监督”解决数学问题有关。

但这一研究成果的贡献列表中并未出现Jakub Pachocki和Szymon Sidor的名字。

另外有人猜测,7月份加入OpenAI的“德扑AI之父”Noam Brown也可能与这个项目有关。

他在加入时曾表示要把过去只适用于游戏的方法通用化,推理可能会慢1000被成本也更高,但可能发现新药物或证明数学猜想。

符合传言中“需要巨大计算资源”和“能解决一定数学问题”的描述。

虽然更多的都还是猜测,但合成数据和强化学习是否能把AI带到下一个阶段,已经成了业内讨论最多的话题之一。

英伟达科学家范麟熙认为,合成数据将提供上万亿高质量的训练token,关键问题是如何保持质量并避免过早陷入瓶颈。

马斯克同意这个看法,并提到人类所写的每一本书只需一个硬盘就能装下,合成数据将远远超出这个规模。

但图灵奖三巨头中的LeCun认为,更多合成数据只是权宜之计,最终还是需要让AI像人类或动物一样只需极少数据就能学习。

莱斯大学博士Cameron R. Wolfe表示,Q-Learning可能并不是解锁AGI的秘诀。

但将“合成数据”与“数据高效的强化学习算法”相结合,可能正是推进当前人工智能研究范式的关键。

他表示,通过强化学习微调是训练高性能大模型(如ChatGPT/GPT-4)的秘诀。但强化学习本质上数据低效,使用人工手动标注数据集进行强化学习微调非常昂贵。考虑到这一点,推进AI研究(至少在当前范式中)将严重依赖于两个基本目标:

让强化学习在更少数据下表现更好。 尽可能使用大模型和少量人工标注数据合成生成高质量数据。

……如果我们坚持使用Decoder-only Transformer的预测下一个token范式(即预训练 -> SFT -> RLHF)……这两种方法结合将使每个人都可以使用尖端的训练技术,而不仅仅是拥有大量资金的研究团队!

One More Thing

OpenAI内部目前还没有人对Q*的消息发表回应。

但奥特曼刚刚透露与留在董事会的Quora创始人Adam D’Angelo进行了几个小时的友好谈话。

看来无论Adam D’Angelo是否像大家猜测的那样是这次事件的幕后黑手,现在都达成和解了。

参考链接:

[1]https://www.theinformation.com/articles/openai-made-an-ai-breakthrough-before-altman-firing-stoking-excitement-and-concern

[2]https://www.reuters.com/technology/sam-altmans-ouster-openai-was-precipitated-by-letter-board-about-ai-breakthrough-2023-11-22/

[3]https://www.youtube.com/watch?v=ZFFvqRemDv8

[4]https://www.youtube.com/watch?v=Ft0gTO2K85A

[5]https://x.com/cwolferesearch/status/1727727148859797600

[6]https://twitter.com/DrJimFan/status/1727505774514180188

— 完—

MEET 2024大会定档!

首批嘉宾阵容公布

量子位MEET2024智能未来大会正式定档12月14日!点击报名线下参会

李培根院士、360集团梁志辉、小冰李笛、浪潮刘军、昆仑万维方汉、商汤科技王晓刚、DeepWay田山、千挂科技廖若雪、潞晨科技尤洋、小米集团栾剑、蚂蚁集团杨铭、星动纪元陈建宇等嘉宾已确认出席。

点击“预约”按钮,一键直达大会直播现场!

点这里


返回网站首页

本文评论
思维造物放弃IPO,罗振宇:一切都是最好的安排(逻辑思维 罗振宇上市)
图片来源:思维造物供图   经历了数度“中止”又重启,罗振宇向上市发起的冲击以“终止”画上了句点。   深交所创业板8月2日披露,北京思维造物信息科技股份有限公司(以下简称...
日期:08-05
超强台风“杜苏芮”登陆后还将深入内陆:一路北上河南、山东、河北
今天,今年第5号台风杜苏芮”(超强台风级)已经绕过菲律宾吕宋岛高山,向我国逼近,中央气象台也在18时发布最高等级的台风红色预警。今天17时许,已经维持超强台风级别超过45小时的杜...
日期:07-27
单卡30秒跑出虚拟3D老婆!Text to 3D生成看清毛孔细节的高精度数字人,无缝衔接Maya、Unity等制作工具
声明:本文来自于微信公众号 量子位 (ID:QbitAI),衡宇 萧箫 发自 凹非寺 ,授权转载发布。ChatGPT给AI行业注入一剂鸡血,一切曾经的不敢想,都成为如今的基操。正持续进击的Text-to-3...
日期:05-09
移远通信技术支持「再获新突破!移远通信RedCap模组拿下首张端网协同测评证书」
通信世界网消息(CWW)为进一步推动5G技术的商用和普及,今年8月初,移远通信与广东联通联合建立了5G端网能力研究联合实验室(以下简称“联合实验室”),双方将在5G及RedCap各项性能的研...
日期:09-13
行业峰会集中爆发 CC视频全程直播提高年会档次_cc直播2019盛典
  自改革开放以来,一大批企业从纤纤幼苗长成参天大树,各行各业都出现领军企业,撑起该行业经济的半壁江山。 近年来,互联网行业的发展最为异军突起,诞生了许多像腾讯、阿里等优...
日期:07-24
微信的聊天记录占比,被网友玩成了新一代 MBTI ?「微信聊天记录占多少内存」
提起微信,网友们总喜欢玩一个梗:小而美。自 2021 年张小龙在微信之夜演讲上提到这词后,它就被刻在大家 DNA 里了。因为「 小」这个字,怎么看都不像是和微信沾上边的。比如世超就...
日期:09-06
联通靓号拍卖网「打破纪录?联通靓号15666666666起拍价高达1366万元」
【手机中国新闻】你永远不知道一些手机靓号能值多少钱,经过拍卖平台上的价格追逐之后,它们的“身价”可能达到你难以想象的地步。9月13日消息,阿里资产拍卖平台近日上线了一个...
日期:09-22
阿迪鞋误标1元 网友订单被强制取消(nike取消订单黑号)
1元钱就能买到阿迪鞋?确实有这样的好事,前几日,当当网上的一名网商误将1件库存量写成了1元价格,发布在网上,结果在凌晨几分钟内引来数百名网友抢购,但最后交易被迫取消。昨日,当当...
日期:07-22
优酷客户端“爱酷”装机量急升 互联网用户“视频总动员”
  近日,记者从中国第一视频网站优酷(NYSE:YOKU)了解到,其客户端产品爱酷自3月中旬升级以来,活跃用户数有明显提升,与年初相比增长超过30%,中西部城市活跃用户增幅更加明显,现在爱...
日期:07-28
618大促iPhone 14直降千元起「2022年iphone14价格」
每年的电商节日通常是购买iPhone的好时机,而今年的618活动已经开启。多个电商平台都已开始预热并销售商品,其中售价为4999元的iPhone优惠力度可谓相当不错,和官网的5999元相比...
日期:05-31
三证齐全!华为Mate 50系列或将于9月6日发布_华为最新50
数码博主@数码闲聊站在微博透露,华为新机三证已齐,配置上,除了常规的人脸识别,还有一系列全新功能。(图来源于网络)据相关消息透露,华为Mate 50系列将采用类钻排列新基材屏幕,支持LT...
日期:09-22
佳能相机 ixus 255「佳能相机ixus255hs和245拍人照哪个好」
是一款便携式数码相机,采用了像素高达1200万像素的高性能CMOS传感器,在各项指标中表现出色。下面我们一起了解更多关于的细节信息。首先是的外观设计,它是一款非常轻便的相机,外...
日期:05-29
惠普发布 Elite x2 G8 平板:13 英寸 3K 屏,内置追踪器不怕丢(惠普elite x2 g4)
  1 月 11 日消息 根据外媒 Notebookcheck 的消息,惠普今天发布了 Elite x2 G8 平板,搭载了英特尔 11 代酷睿和 13 英寸屏。   惠普Elite x2 G8 平板可选英特尔第 11 代...
日期:06-26
上万的月饼_月饼新规来了!电商再难见500元以上的月饼
记者|俞瑶 张露曦; 编辑|余冬梅 于曼歌   距一年一度的中秋节还有不到一个月的时间,月饼已被各大商家摆放售卖。但今年的月饼行情有了新变化。   一位做定制月饼加补品礼...
日期:08-16
中国移动视频彩铃制作_北京移动开启视频彩铃时代 打造个性定制新玩法
  对于大部分手机用户而言,彩铃不是一个陌生词,各种各样的彩铃代替了沉闷的“嘟嘟”回铃声,改变了人们以往等待电话接通时的单调,能够在等待中享受到一定的愉悦。视频彩铃的...
日期:04-25
出现android设备登陆网络_Android 4.0设备已开始访问网络
  据国外媒体报道,当前,谷歌正在为其下一代Android移动操作系统做最后的冲刺,并计划在未来一段时间中将其连同设备一起发布。   之前,谷歌曾多次提及下一代Android操作系统...
日期:07-23
全方位助力混合办公 联想集团CES前发布ThinkPad,X1、ThinkVision多款新品
2023国际消费电子展(CES)终于迎来全面复苏。CES召开之前,全球科技巨头联想集团率先推出首批包含ThinkPad X1, IdeaPad等在内的系列新品预热,CES期间还将亮相更多值得关注的创新...
日期:09-20
快递公司开始复工!_物流公司什么时候复工
  (原标题:快递公司开始复工!申通、韵达、中通等宣布今日全面恢复正常运营)   企业推迟返工,加上部分地区交通管控,很多商品即便商家备好货,都在等待快递公司揽收,随着快递...
日期:04-17
Facebook可能遭德国罚款:脸部识别侵犯隐私(facebook被入侵)
  北京时间11月10日晚间消息,因脸部识别应用未遵守欧盟和德国相关法律,Facebook可能招致德国数据保护机构的罚款。   德国汉堡市数据保护机构周四在其官方网站上宣布,Face...
日期:07-24
迷人又危险,年味里的烟花生意_有了烟花才有年味
声明:本文来自于微信公众号深燃(shenrancaijing),作者 | 邹帅编,辑 | 唐亚华,授权转载发布。“好久没在朋友圈看到过这么多烟花了。”刚刚过去的除夕夜,大家的一致感受是,烟花里的年...
日期:01-24