您的位置:首页 > 互联网

OpenAI 的 GPT-4 变得「懒惰」和「愚蠢」:或被 MoE 彻底重塑导致性能下降

发布时间:2023-07-13 20:00:00  来源:互联网     背景:

7月13日消息:世界上最强大的人工智能模型似乎变得不那么强大了。这让业内人士开始谈论可能会对该系统进行重大重新设计。

OpenAI,ChatGPT,人工智能,AI

最近几周,OpenAI 的 GPT-4 的用户们纷纷抱怨性能下降,有些人将这个模型与以前的推理能力和其他输出进行比较,称其变得「懒散」和「更笨」

在 Twitter 上和 OpenAI 的在线开发者论坛上,用户们发表了对弱化逻辑、更多错误响应、追踪不到提供的信息、难以按照指令操作、忘记在基本软件代码中添加括号以及只记住最近的提示等问题的不满。

一位使用 GPT-4 来帮助编写网站功能的开发者写道:「现在的 GPT-4 令人失望。就像你开了一个月的法拉利,然后突然变成了一辆破旧的皮卡车。我不确定是否愿意为此付费。

Roblox 的产品负责人 Peter Yang 在推特上表示,该模型生成速度更快,但质量更差。「只是一些简单的问题,比如使文本更清晰、更简洁,以及生成想法,」他补充道。「在我看来,写作质量下降了。」他问是否有其他人注意到了这一点。

另一位名为 Frazier MacLeod 的用户回答说:「我发现它变得更懒散了。」

三星发布会S22

Christi Kennedy 在 OpenAI 的开发者论坛上写道,GPT-4 开始一遍又一遍地循环输出代码和其他信息。

从缓慢且昂贵,到快速且不准确

与今年年初的情况相比,这是一个相当大的变化。当时 OpenAI 通过 ChatGPT 和 GPT-4 的推出赢得了全世界的赞誉,科技行业也在翘首以待 GPT-4 的发布。ChatGPT 最初运行在 GPT-3 和 GPT-3.5 上,它们是支撑其神奇回答的巨大基础 AI 模型。

更大的 GPT-4 于三月份推出,并迅速成为开发者和其他科技行业内部的首选模型。它被认为是目前最强大的广泛可用的 AI 模型,并且是多模态的,可以理解图像和文本输入。

在尝试这个新模型后的最初热潮之后,一些人对使用 GPT-4 的账单感到震惊。Lamini 创业公司的首席执行官 Sharon Zhou 表示,它的速度很慢,但非常准确。

忒修斯之船

iphone7召回

然而,几周前情况发生了变化。GPT-4 的速度变快了,但性能明显下降,这引发了整个 AI 社区对重大变化正在发生的讨论,Zhou 和其他专家表示。

他们认为 OpenAI 正在创建几个较小的 GPT-4 模型,这些模型的行为类似于大模型,但运行成本更低。

据 Zhou 称,这种方法被称为专家混合(Mixture of Experts,MoE)。这些较小的专家模型分别针对不同的任务和领域进行训练。可能会有一个用于生物学、物理学、化学等的小型生物学家 GPT-4。当一个 GPT-4 用户提出问题时,新系统知道将查询发送给哪个专家模型。新系统可能会决定将查询发送给两个或更多的专家模型,以防万一,然后将结果混合在一起。

Zhou 表示:「这个想法已经存在一段时间了,这是自然而然的下一步。」

Zhou 将这种情况比作「忒修斯之船」思想实验,在这个实验中,船的部分逐渐被更换,引发了一个问题:在哪个时刻它成为了一个全新的船?

她说:「OpenAI 正在将 GPT-4 转变为一支由较小船只组成的小型舰队。」「从我的角度来看,这是一个新模型。有人可能会说它是一样的。」

本周,几位 AI 专家在推特上发布了他们声称是 GPT-4 架构细节的内容。初创公司创始人 Yam Peleg 在推特上表示,OpenAI 通过使用 16 个专家的混合模型来降低成本。Semianalysis 在本周写了关于 GPT-4 内部工作原理的文章

网络智能机顶盒技术要求和测试方法

开发者和黑客 George Hotz 在最近的一期播客中描述了 GPT-4 的「八路混合模型」。Meta 的 PyTorch 开源 AI 项目联合创始人 Soumith Chintala 对 Hotz 的评论表示了支持。

在看到本周在线泄露的消息后,Allen 人工智能研究所的创始首席执行官 Oren Etzioni 在一封电子邮件中写道:「我推测这些猜测大致是准确的,但我没有得到证实。」

他解释说,使用 MOE 方法有两个主要的技术原因:生成更好的响应,以及更便宜、更快的响应。

他补充说:「『正确的』混合将同时给你带来这两个好处,但通常在成本和质量之间存在权衡。」「在这种情况下,OpenAI 似乎在为降低成本而牺牲了一些质量。这些模型很难进行评估(什么样的响应更好?在什么情况下?),所以这只是凭经验而非科学的观察。

2022 年,OpenAI 的总裁 Greg Brockman 与其同事 Lilian Weng 共同撰写的研究中提到了 MOE 方法。他们写道:「使用专家混合(Mixture-of-Experts,MoE)方法,仅使用网络的一小部分来计算任何一个输入的输出。一个例子是通过推理时的门控机制选择使用哪个权重集合。」「这样做可以在不增加计算成本的情况下增加更多参数。每个权重集合被称为『专家』,希望网络能够学习将专业计算和技能分配给每个专家。

最近几周 GPT-4 性能下降的情况可能与这种训练有关,OpenAI 正在推出这一批较小的专家级 GPT-4 模型,Zhou 表示。

oppo reno6 pro是什么中框

Zhou 解释说:「当用户对其进行测试时,我们会提出许多不同的问题。它的表现可能不太好,但它正在从我们这里收集数据,并且会不断改进和学习。」


返回网站首页

本文评论
“二舅币”圈钱后暴跌99.7%! 交易仍在进行,还有人上当?
  文 | 周文猛   编辑 丨 韩大鹏   划重点:   1、虽然“二舅币”的代币SUC价格已下跌99.7%,但昨天仍有交易进行。根据相关网站,目前该币的卖出已多于买入,且买入金额...
日期:08-03
显卡rtx3060和3060ti「超越RTX 3060是有条件的 Intel显卡喜新厌旧:要看平台、游戏」
Intel在9月底正式发布了Arc A770及A750系列显卡,这是Arc品牌下的旗舰级显卡,算上A380、A310及A580等,代号炼金术师”的GPU家族布局算是完成了。售价方面,A750 8GB显卡售价289元,A...
日期:10-14
北大—奇安信区块链安全实验室正式成立_北大信息安全实验室
  在8月12日举行的北京网络安全大会(BCS 2020)“数字金融内生安全建设论坛”上,,奇安信集团董事长齐向东、北京大学科技开发部部长姚卫浩、奇安信首席战略官刘勇、北京大学...
日期:07-15
中国联通集中采购_中国联通携号转网选定供应商:核心网部分向华为单一采购
  中国联通日前发布公告显示,公司携号转网项目(核心网部分)将通过单一来源方式向华为进行采购。   公告指出,本项目需要新建NPHLR设备和NPMSC设备,完成携号转网用户的查询...
日期:05-02
小米12S Ultra双11促销:立减1000
双11的活动已经正式开始了,小米旗舰店已经开始了立减优惠,小米12S Ultra发布以来首次开始促销,Plus会员领券最高可享受600元的优惠,低存储版的入门版也有300元优惠,5499元的到手...
日期:11-04
Shopee与极客时间联合打造一专多能型人才(shopee极速入驻)
  在互联网职业教育1.0和2.0时代,人才培养侧重于某一专业领域的知识或技能的学习。而到了3.0时代,T型人才成为培养主流。“T”中的“—”表示广博的知识面,“|”表示专业的...
日期:07-16
无限复制没了?《塞尔达传说:王国之泪》1.1.1更新发布:修复主线任务Bug
5月19日消息,今日,《塞尔达传说:王国之泪》发布1.1.1版本更新,主要修复主线任务紧闭之门”的Bug,同时,为优化游戏体验,还修正了其他若干问题。更新说明为,修复了在紧闭之门”中,即使...
日期:05-19
“被首尔的出租车惊到了”上热搜:网友晒国内出租车 都是弟弟_韩国首尔打车贵吗
“被首尔的出租车震惊到了”这个话题上了热搜,不少网友看完之后也是很感慨,怎么会这么闪耀吗?近日,一位网友在韩国旅行时,乘坐的出租车内饰让他震惊不已。据网友晒出的照片显示,这...
日期:07-13
英伟达股价多少「得益于AI的繁荣发展,英伟达估值达到 1 万亿美元」
5月31日 消息:当地时间周二早上,Nvidia股价持续上涨,一度成为一家估值达1万亿美元的公司。其估值不断上升,主要得益于众多科技公司开始产品中添加生成人工智能工具。 在最近Go...
日期:05-31
小米9 imx「小米13真机曝光!IMX989或成标配」
中关村在线消息:10月17日,据相关爆料,小米13新机曝光,通过图片我们不难看出,该机在外观设计方面与小米12系列出入不大,但是后置影像模组变成了正方形方案,新机或将采用后置三摄方案...
日期:10-18
M2 Pro、Max图形处理器跑分曝光:较前代提升34.1% 媲美M1 Ultra
前两天苹果低调发布了新款MacBook 14/16笔记本,主要是升级了M2 Pro、M2 Max处理器,昨日搭载M2 Pro的MacBook处理器跑分首次曝光之后,苹果表示,M2 Pro的 CPU 性能比 M1 Pro 最多...
日期:01-22
烤鸭店喝白开水也收费?店方回应「烤鸭店需要多少钱?」
4月17日消息,据毒秒财经报道,北京有网友吐槽一烤鸭店喝白开水要收费,3元1位。华为技术有限公司2019年报这位网友在社交平台上发帖表示,他是通过小红书找到了这家门店,大家都说好...
日期:04-17
华为昇腾isv「华为宣布昇腾AI集群升级 推出首个万卡AI集群」
7月7日消息,华为近日宣布升腾AI集群全面升级,集群规模从最初的4000卡集群扩展至16000卡,是业界首个万卡AI集群。斯巴鲁2.5xt发动机目前,升腾AI集群已支撑全国25个城市的人工智能...
日期:07-07
Transformer在GitHub上星标破10万大关
5月18日 消息:今天,NLP领域的主流模型Transformer在GitHub上星标破10万大关,成为AI领域的基石王者,也是继Tensorflow和Auto-GPT之后第三个突破10万星的机器学习库。Transformer...
日期:05-18
蔚来宣布2023年拟新增1000座换电站「蔚来换电站 规划」
2 月 21 日讯:蔚来宣布, 2023 年换电站建设目标将从原定的 400 座提升至 1000 座,到 2023 年累计建成的换电站将超过 2300 座。小米10pro esimlg5g专利...
日期:02-22
米哈游诉B站UP主泄露原神角色获赔1.5万_米哈游吧b站告了
2月2日 消息:天眼查App显示,近日,上海米哈游天命科技有限公司与施某某相关侵害作品信息网络传播权纠纷一审法律文书公开。苹果手机取消转移呼叫文书显示,原告米哈游公司诉称,被...
日期:02-02
人工智能打造“功夫熊猫”是深兰科技公交智能转型之路之一
  深兰科技自2017年开始尝试整车设计,一路至今,推出多项应用成果,同时取得多个城市的自动驾驶牌测试照。经过三年中无数次的钻研和打磨,最终形成的熊猫智能公交整合自动驾驶...
日期:07-16
国美零售宣布拟重组公司业务板块 目标三年超越历史最好水平(国美零售2020年业绩)
  本报记者;贾;丽  8月19日晚间,国美零售发布公告称,公司将于8月22日正式复牌。同时,国美零售宣布拟重组公司业务板块,剥离亏损业务,注入大股东两处物业及安迅物流部分股权,以...
日期:08-23
百度世界引来学生参与 实习生“郝超”首页成亮点
百度爱好者(Baiduer.com.cn)消息,9月2日在京举办的百度世界2011得到了圆满的结束。在大会的现场除了到场参加的宾客以外,很多的学生朋友也参与其中,并作为大会志愿者为大家服务...
日期:07-22
餐饮配送巨头Deliveroo在伦敦开了一家现实版的杂货店「order delivery外卖」
Deliveroo公司正在消化所有的数据,这家出生于伦敦的曾经的餐厅配送巨头 - 现在是无所不在的商品跑腿供应商正经利用一系列关于购物和膳食计划习惯的调查结果来发展或许业务,跟...
日期:10-05