您的位置:首页 > 互联网

OpenAI科学家最新演讲:GPT-4即将超越拐点,1000倍性能必定涌现!

发布时间:2023-10-11 22:25:15  来源:互联网     背景:

声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。

【新智元导读】GPT-4参数规模扩大1000倍,如何实现?OpenAI科学家最新演讲,从第一性原理出发,探讨了2023年大模型发展现状。

GPT-4即将超越拐点,并且性能实现显著跳跃。

这是OpenAI科学家Hyung Won Chung在近来的演讲中,对大模型参数规模扩大能力飙升得出的论断。

在他看来,我们所有人需要改变观点。LLM实则蕴藏着巨大的潜力,只有参数量达到一定规模时,能力就会浮现。

Hyung Won Chung将这次演讲题目定为2023年的大型语言模型,旨对LLM领域的发展做一个总结。

在这个领域中,真正重要的是什么?虽然模型扩展无疑是突出的,但其深远的意义却更为微妙和细腻。

在近一个小时的演讲中,Hyung Won Chung从三个方面分享了自己过去4年从业以来对扩展的思考。

都有哪些亮点?

参数规模越大,LLM势必涌现

Hyung Won Chung强调的核心点是,持续学习,更新认知,采取以“规模”为先的视角非常重要。

因为只有在模型达到一定规模时,某些能力才会浮现。

多项研究表明,小模型无法解决一些任务,有时候还得需要依靠随机猜测,但当模型达到一定规模时,就一下子解决了,甚至有时表现非常出色。

因此,人们将这种现象称之为涌现。

即便当前一代LLM还无法展现出某些能力,我们也不应该轻言它不行。相反,我们应该思考它还没行。

一旦模型规模扩大,许多结论都会发生改变。

这促使许多研究人员能够以一个新的视角去看待这个问题,即推理思路的根本性转变,从一些方法现在不起作用,到一些方法只是在当前不起作用。

也就是,最新方法可能不适用于当前模型,但是3-5年后,可能变得有效。

有着新颖视角的AI新人,通常可以带做出有影响力研究。那是因为他们不受一种直觉和想法的束缚,即经验丰富的人可能已经尝试过但发现不成功的方法。

Hyung Won Chung表示,自己平时在实验过程中,会记录下失败的过程。每当有了新的模型,他就会再次运行实验,再来查验哪些是成功的,哪些是失败的,以此往复。

这样一来,就可以不断更新和纠正自我认知和理解,适应技术的日新月异。

目前,GPT-3和GPT-4之间的能力仍然存在显著差距,尝试去弥合与当前模型的差距可能是无效的。

那么,已经有了规模的发展性观点后,我们该如何扩大参数规模?

第一性原理看Transformer

迄今为止,所有大模型背后的架构都是基于Transformer搭建的。想必很多人已经对下图的样子熟记于心。

这里,Hyung Won Chung从第一性原理出发探讨Transformer的核心思想,并强调了Transformer内部架构细节并非关注重点。

他注意到,许多LLM的研究者不熟悉扩展的具体操作。因此,这部分内容主要是为那些想要理解大型模型训练含义的技术人员准备的。

从功能性角度来看,可以把Transformer看作带有矩阵乘法一种简洁的序列到序列的映射,并可以进行相应数组转换。

所以,扩大Transformer的规模就是,让很多很多机器高效地进行矩阵乘法。

通过将注意力机制拆分为单独的头,利用多台机器和芯片,并使用GSP MD方法进行无需通信的并行化。

然后借助Jax的前端工具PJ将阵列轴映射到硬件,可以实现大型语言模型的并行化。

预训练模型的规模将跨越数量级,缩放法则是用小规模模型开发的。

泰迪熊移动科技公司

1万倍GPT-4,让神经网络学习目标函数

再进一步扩展模型规模时,设想是GPT-4的10000倍,应该考虑什么?

对Hyung Won Chung来说,扩展不只是用更多的机器做同样的事情,更关键的是找到限制进一步扩展的归纳偏差(inductive bias)。

总之,扩展并不能解决所有问题,我们还需要在这大规模工程的工作中做更多研究,也就是在后训练中的工作。

友达144hz笔记本屏幕

你不能直接与预训练模型对话,但它会在提示后继续生成,而不是回答问题。即使提示是恶意的,也会继续生成。

模型后训练的阶段的步骤包括,指令调优——奖励模型训练——策略模型训练,这也就是我们常说的RLHF。

天猫超市直播间主播

尽管RLHF有着一些弊端,比如奖励模型容易受到奖励黑客的影响,还有开放的研究问题需要解决,但是我们还是要继续研究RLHF。

因为,最大似然法归纳偏差太大;学习目标函数(奖励模型)以释放缩放中的归纳偏差,是一种不同的范式,有很大的改进空间。

另外,RLHF是一种有原则的算法 ,需要继续研究,直到成功为止。

总之,在Hyung Won Chung认为,最大似然估计目标函数,是实现GPT-410000倍规模的瓶颈。

使用富有表达力的神经网络学习目标函数,将是下一个更加可扩展的范式。随着计算成本的指数级下降,可扩展的方法终将胜出。

不管怎么说,从第一原理出发理解核心思想是唯一可扩展的方法。

参考资料:

rtx3050显卡平均功耗

https://twitter.com/xiaohuggg/status/1711714757802369456?s=20

https://twitter.com/dotey/status/1711504620025942243

https://docs.google.com/presentation/d/1636wKStYdT_yRPbJNrf8MLKpQghuWGDmyHinHhAKeXY/edit#slide=id.g27b7c310230_0_496


返回网站首页

本文评论
三星携手Roblox推出《Space Tycoon》元宇宙制造收集游戏
三星刚刚推出了一款名叫《Space Tycoon》的“元宇宙”游戏,玩法是在虚拟世界里收集该公司的电子产品。不过对于这家韩国科技巨头来说,这款游戏更多的意义是给自家做宣传、以吸...
日期:08-01
运行txt文本也可能中毒!微软9月补丁急修“文本病毒”漏洞
  记事本文本(txt)一向被人们视为不可能带毒的安全文件,然而最新曝出的Windows漏洞(MS11-071)却使“文本病毒”成为现实。360安全中心提醒网民,针对Windows漏洞制作“文本...
日期:07-23
手机wifi上网流量_手机wifi上网流量限制
随着移动互联网的快速发展,手机wifi上网已成为人们日常生活中最为常见的网络使用方式之一。手机wifi上网不仅速度快、流畅,且消耗流量非常少,给人们带来了极大的便利。手机wifi...
日期:05-29
雅迪冠能系列全球销量突破1500万台!全民影响力诠释行业领航者本色
   8 月 26 日,雅迪 2023 冠能音乐节在贵阳盛大举行。现场,国际知名咨询机构——弗若斯特沙利文(Frost & Sullivan,以下简称“沙利文”)向雅迪科技集团颁发了雅迪冠能系列累计...
日期:08-29
元宇宙公司招聘「元宇宙相关岗位平均月薪1.85万元 最高能拿4万」
  来源:快科技  元宇宙作为第三代互联网形态,其时空拓展、高度沉浸、感官延伸、人机融生等特点,让人心生向往。目前各大企业也纷纷布局元宇宙。  9月26日,智联招聘发布《2...
日期:09-27
海尔智家表彰全球千余名科研人才「海尔智家专利」
科技的创新,正潜移默化地改变着你我的生活方式:以前进厨房总嫌凸出的冰箱碍事,如今它已经能跟橱柜融为一体;从前父母总唠叨不要直冲空调,但如今空调已经能自己绕开老人、小孩送风...
日期:04-20
谷歌员工要求公司为临时工提供堕胎福利(谷歌员工要求公司为临时工提供堕胎福利是真的吗)
讯 北京时间8月19日消息,超过650名Alphabet旗下谷歌员工向公司请愿,要求公司为合同工提供堕胎福利,暂时停止向反堕胎政治家捐款,保护好用户,使之免受虚假堕胎信息及警方要求的影...
日期:08-20
2010十大营销事件揭晓 360“免费战”入选
  近日,“2010第三届时代营销盛典”在世界第一大高尔夫球会观澜湖揭晓。360 公司凭借“免费杀毒”系列整合传播被评为年度十大营销事件,同时获得这一荣誉的还有万科、招商...
日期:07-25
投资赚了12000倍 腾讯第一大股东暂停减持:已套现超千亿「腾讯2018年大股东减持」
就像软银投资阿里一样,南非Naspers公司投资腾讯也是一个经典的案例,20多年前的3200万美元一度价值超3000多亿美元,盈利12000多倍,去年到今年该公司多次减持腾讯股票,套现已经超过...
日期:10-29
一加pro参数「安卓最大!一加Ace2 Pro搭载大体积X轴线性达:两种振感叠加」
快科技8月11日消息,一加Ace2 Pro将在8月16日14:30登场,全球首发24GB LPPDR5X内存,这个容量已经比很多人的电脑内存容量还大。中粮我买网网站一加手机今日宣布,一加Ace2 Pro将会...
日期:08-11
信安iCET密评工具箱系统:助力密评合规高效,护航安全体系建设_北京信密安科技有限公司
背景介绍密码测评是国家落实网络安全战略的重要手段,新近出台的《商用密码管理条例》强调,法律、行政法规和国家有关规定要求使用商用密码进行保护的关键信息基础设施,其运营者...
日期:06-15
英伟达正考虑将其部分人工智能GPU外包给三星电子制造_英伟达技术
据报道,英伟达正考虑将其部分人工智能 GPU 外包给三星电子进行制造,因为台积电供应能力日益紧张。行业观察人士指出,如果三星的 3 纳米试验产品通过性能验证,并且其 2.5D 先进封...
日期:09-22
vivo影像旗舰「vivo 推出 6nm 自研影像芯片 V3,安卓首发 4K 电影人像视频」
IT之家 7 月 30 日消息,vivo 今天下午举行了 vivovivo 影像盛典特别活动,正式推出全新自研影像芯片 V3。谷歌收购deepmind据介绍,V3 首次采用 6nm 制程工艺,能效较上代提升了 30...
日期:07-30
爆料:OpenAI工程师年薪90万美元!Sam Altman独创特殊股权给员工「画饼」_openai创始人
声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。【新智元导读】作为当今最热门、最神秘的AI初创公司,OpenAI的薪酬结构究竟是怎样的?外国招聘网站记者...
日期:06-26
谷歌:iPhone 14无创新 甚至抄袭安卓「苹果抄袭htc」
在十一假期期间,谷歌正式发布了搭载原生安卓13系统的Pixel 7系列旗舰手机,而在发布会中,谷歌一直在嘲讽iPhone 14,甚至说“苹果是手机行业创新的追随者”,毫无创新。谷歌产品管理...
日期:10-12
中兴通讯重磅推出新一代FTTR产品——RoomPON 5.0_中兴lte
通信世界网消息(CWW)2023年9月6日,中兴通讯“全光家庭高峰发展论坛暨中兴通讯RoomPON 5.0新品发布” 在深圳光博会期间举行。本次活动以促进FTTR商业成功和生态繁荣为目标,吸引...
日期:09-07
Outlook将很快支持对邮件作出表情反应而不发送回复「outlook发邮件未响应」
一段时间以来,人们如何通过电子邮件进行互动已经有点僵化,从如何发送电子邮件到撰写回复。虽然说清楚并确保将信息信息正确地转达给收件人是极其必要的,但在有些情况下,回应可能...
日期:10-18
业内分析师表示Windows 8的整合要等到2013年才能完成
  业内分析师警告称,微软对ARM处理器的支持将导致Windows 8部署的严重问题。三位微软的前雇员,目前担任研究机构Directions on Microsoft的分析师,他们表示ARM和Windows 8的...
日期:07-25
腾讯Q2财报:视频号连接发力 助中小微商业打通新闭环_腾讯财报q2时间
  8月18日,腾讯披露2021年二季度及半年度业绩。二季度,腾讯实现营收1382.59亿元,同比增长20%;净利润(Non-IFRS)340.39亿元,同比增长13%。   在持续加大社会价值创新投...
日期:07-17
微软强化显示广告业务挑战谷歌Facebook
  微软将强化其显示广告服务的功能,旨在阻止客户投奔谷歌和Facebook等竞争对手。   美国互联网显示广告市场规模高达123亿美元,微软日前表示将推出了一些新工具,并与AppNe...
日期:07-22