您的位置:首页 > 互联网

gpt-3「GPT-4 被曝“变蠢”!为了降本,OpenAI 偷偷搞“小动作”?」

发布时间:2023-07-14 13:43:12  来源:互联网     背景:

总结:近期,有用户在 OpenAI 的在线开发者论坛中反映,GPT-4的质量似乎有所下降,变得更 “蠢” 了。用户指出,GPT-4在长篇内容的分析和创作上退步明显,并且写作质量下降。一些开发者也表示,GPT-4在逻辑能力、编码能力等方面都出现了问题,出现了循环输出代码、错误响应等情况。有专家猜测,OpenAI 可能在创建一些较小的 GPT-4模型,这些模型类似于大型模型,但运行成本较低。他们推测可能与混合专家系统(MoE)技术有关,通过使用多个专家模型来降低运行成本。此外,一位推特博主还透露了 GPT-4的架构细节,称其有大约1.8万亿个参数,比 GPT-3大10倍以上。尽管 OpenAI 尚未对这些说法做出回应,但一些 AI 专家认为这种猜测可能是正确的。有人认为,OpenAI 为了降低 GPT-4的成本,可能在一定程度上牺牲了质量。

声明:本文来自于微信公众号CSDN(ID:CSDNnews)),整理 | 郑 丽 媛,授权转载发布。

“你们有没有觉得,最近 GPT-4的质量有所下降?”

早在今年5月中旬开始,就有 GPT-4用户在 OpenAI 的在线开发者论坛中发帖,表示 GPT-4好像开始“变蠢”了:

“我使用 ChatGPT 已经有一段时间了,自 GPT-4发布后,我就成为了 GPT Plus 用户。我一般会用 GPT-4来助力长篇内容的分析和创作。过去,GPT-4似乎能很好地理解我的要求。但现在,它似乎失去了对信息的跟踪,给了我很多错误的信息,误解我要求的情况也越来越多……目前,GPT-4感觉更像 GPT-3.5。

有没有其他人注意到这一点,还是说只有我偶然遇到了这个问题?”

gpts

事实证明,这位 GPT-4用户并不是一个人——该帖下,许多用户都留言称:“我也很有同感!”

问题百出的新版 GPT-4

根据许多使用者的反馈,GPT-4除了在长篇内容的分析和创作上表现有所退步,在写作质量上也有所下滑。

Roblox 的产品负责人 Peter Yang 在推特上表示,GPT-4模型的输出更快了,但质量变差了:“只是简单的问题,例如让写作更清晰简洁并提供想法……在我看来,写作质量下降了。”

gpt/l

在讨论/评估复杂的逆问题、不同的变化率或变化模式以及时空变异性时,最新版 GPT-4的逻辑能力明显下降。

“在 GPT-4更新之前,我很少收到错误的回复,但现在我必须仔细检查所有输出(即,现在双重否定条件有时不能适当地转换为肯定条件)。我认为这些错误更类似于 GPT-3.5,而不是之前的 GPT-4推理水平。”

gpt42

甚至在编码能力上,新版 GPT-4的输出质量也不如以往。

note20 ultra还是iphone12promax

一位用 GPT-4为网站编写功能代码的开发者抱怨:“目前的 GPT-4很令人失望。这就像开了一辆法拉利一个月,然后突然变成了一辆破旧的皮卡,我不确定我是否会愿意继续为此付费。”

另一位开发者也提到现在的 GPT-4会循环输出代码:“完全糟透了,GPT-4开始一遍又一遍地循环输出代码或其他信息。我让它写代码,它写到一个点,突然来个"````",然后又开始!和以前相比,它现在简直就是个白痴。”

gpt43

除此之外,在推特和 OpenAI 的在线开发者论坛中,也不断有用户反映新版 GPT-4逻辑弱化、产生很多错误响应、无法跟踪提供的信息、不遵循说明要求、忘记在基本软件代码中添加括号、只记住最近的提示等种种问题。

对于 GPT-4突然“降智”的表现,有用户提出猜测:“当前版本感觉跟刚推出时的版本大不相同,我猜 OpenAI 为了容纳更多客户选择在质量上妥协!”

如此看来,如今用户对于 GPT-4的评价确实比不上它刚出道时的“风评”巅峰期。

GPT-4变快了,却也变“蠢”了

去年年底基于 GPT-3.5的 ChatGPT 横空出世,其卓越的生成能力掀起了一股 AIGC 热潮,因此今年3月 OpenAI 公布比 GPT-3.5更强大的 GPT-4时,全世界都为之惊叹。

当时,GPT-4被称之为“史上最强大的 AI 模型”,尤其多模态的特点,意味着它既能理解图像,也能理解文字输入,于是迅速成为了开发人员和其他技术业内人士的首选模型,也产生了更多对 GPT-4的赞誉:10秒生成一个网站、通过最难美国法考、满分通过 MIT 本科数学考试……

不过在人们惊叹于 GPT-4的强大之时,其产生的费用及响应速度也令不少人感到震惊。对此,Lamini(一家帮助开发者建立定制大型语言模型的初创公司)的首席执行官 Sharon Zhou 表示:“GPT-4虽然速度慢,但非常准确。”

一直到5月份,GPT-4还一直保持着“又慢又贵但很准确”的状态——后来,GPT-4响应变快了,与此同时用户对其性能下降的质疑也爆发了。

对于这个现象,包括 Sharon Zhou 在内的几位 AI 专家认为:OpenAI 可能正在创建几个较小的 GPT-4模型,这些模型的作用与大型模型类似,但运行成本较低。

专家推测:或许与 MoE 技术有关

根据 Sharon Zhou 的介绍,这种方法被称为 Mixture-of-Experts(MoE),即混合专家系统。MoE 技术是在神经网络领域发展起来的一种集成学习技术,也是目前训练万亿参数量级模型的关键技术——由于现阶段模型规模越来越大,导致训练的开销也日益增长,而 MoE 技术可以动态激活部分神经网络,从而实现在不增加计算量的前提下大幅度增加模型参数量。

具体来说,MoE 会将预测建模任务分解为若干子任务,在每个子任务上训练一个专家模型(Expert Model),并开发一个门控模型(Gating Model),该模型可根据要预测的输入来学习信任哪个专家,并组合预测结果。

那么 MoE 技术引用到 GPT-4是什么情况呢?Sharon Zhou 解释道,在 GPT-4中这些小型专家模型会针对不同的任务和主题领域进行训练,例如可以有针对生物、物理、化学等方面的小型GPT-4专家模型,那么当用户向 GPT-4提出问题时,新系统就会知道要把这个问题发送给哪个专家模型。另外,为了以防万一,新系统可能会向两个或更多的专家模型发送查询,然后将结果混在一起。

对于这个做法,Sharon Zhou 的形容是“忒修斯之船”(一种有关身份更替的悖论,假定某物体的构成要素被置换后,但它依旧是原来的物体吗?),即随着时间的推移,OpenAI 会把 GPT-4的各个部分替换掉:“OpenAI 正在将 GPT-4变成一支小型舰队。”

基于以上推测,Sharon Zhou 认为近来 GPT-4“变蠢”的言论,很可能就与 MoE 这种训练方式有关:“当用户测试 GPT-4时,我们会问很多不同的问题,而规模较小的 GPT-4专家模型不会做得那么好,但它正在收集我们的数据,它会改进和学习。”

GPT-4架构曝光?

由于用户对于 GPT-4“变蠢”的反馈越来越多,本周几位 AI 专家也发布了所谓的“GPT-4架构细节”。

其中,一位名为 Yam Peleg 的推特博主表示, GPT-4有大约1.8万亿个参数,横跨120层,比 GPT-3大10倍以上,在约13T token 上进行训练,训练成本约为6300万美元……值得一提的是,Yam Peleg 也表示 OpenAI 在采用 MoE,即通过使用16个混合专家模型来降低 GPT-4运行的成本。

新阶段抖音的电商战略

截至目前,OpenAI 方面并没有对这一说法做出回应。不过 Allen 人工智能研究所的创始首席执行官 Oren Etzioni 向媒体表示:“虽然我也没得到证实,但我认为这些猜测应该大致正确。”

他解释道,一般使用 MOE 方法有两种原因:要么想要生成更好的响应,要么想要更便宜、更快的响应。

“理想情况下 MOE 会让你同时获得这两方面的优势,但现实中通常需要在成本和质量之间做出权衡。”基于此,Oren Etzioni 认为结合现在的情况来看,OpenAI 似乎为了降低 GPT-4的成本而牺牲了一些质量。

那么对于这件事,你的看法又是什么呢?

参考链接:

https://www.businessinsider.com/openai-gpt4-ai-model-got-lazier-dumber-chatgpt-2023-7?utm_source=reddit.com

https://community.openai.com/t/has-there-been-a-recent-decrease-in-gpt-4-quality/207392/9

https://the-decoder.com/gpt-4-architecture-datasets-costs-and-more-leaked/


返回网站首页

本文评论
BBC拟今后两年裁员360人 关闭旗下200家网站
  英国广播公司(BBC)24日宣布,今后两年将关闭旗下200家网站,裁员大约360人,以降低运营成本,应对数字化时代挑战。   英国广播公司说,为实现2013至2014财务年度节省网站制作经...
日期:07-26
微信龙哥视频「微信的一个新能力,据说是龙哥亲手打磨」
声明:本文来自微信公众号“唐韧”(ID:RyanTang007),作者:唐韧,,授权转载发布。昨天我在公众号后台收到一条系统消息,内容是关于授权微信音频播放器引用我公众号发表的内容,默认是开...
日期:04-25
淘宝直播发布《商家成长经营指南》_淘宝直播运营手册
9月30日消息,淘宝直播依托今年宝藏好店主打的“五力模型”推出《商家成长经营指南》,旨在帮助不同层级的商家成功打通成长力、货品力、内容力、流量力、粉丝力五大方面中的“...
日期:10-02
努比亚Z50S Pro跑分数据揭晓 搭载高频版骁龙8 Gen2
7月12日 消息:最近努比亚官方宣布,旗下新机型Z50S Pro将于7月与我们见面。这款手机已经在Geekbench跑分数据库中现身,并且具备强大的性能。iqoo neo5活力版支持内存卡吗根据Ge...
日期:07-12
如果做出媲美OLED的MiniLED电视!海信电视65U8H评测「海信电视55寸u7e和u8e对比」
一、前言:集海信最新显示技术于一身的U8H9月20日,海信带来了全新的U8H系列,定位于海信ULED电视的高端旗舰,号称画面素质可以提供媲美OLED电视。而我们也收到了海信电视65U8H,让我...
日期:10-18
Twitter遭遇专利流氓:或被迫缴纳授权费
腾讯科技讯(万学)北京时间6月4日消息,据国外媒体报道,一家印度软件公司向美国微博网站Twitter发出了警告通知,称其可能侵犯了其正在美国申请并被美国专利及商标局(USPTO)受理的专...
日期:07-28
195亿美元不要了:富士康官宣放弃印度建厂计划 原因没法说
快科技7月11日消息,对于富士康来说,其已经放弃规模为195亿美元的印度芯片工厂计划,至于原因没法细说。富士康对外公告称,不再推进与Vedanta的195亿美元半导体工厂建厂行动。双方...
日期:07-11
1680一条,王者荣耀卖起真人“皮肤”「王者荣耀的真人」
声明:本文来自于微信公众号 电商在线(ID:dianshangmj),作者:王崭,授权转载发布。“你这裙子还挺好看的,什么牌子呀价位多少?”“王者荣耀的,1680元。”屡屡因“皮肤(游戏角色装扮)”引...
日期:05-18
一分钟售罄、数万人围观,快手商家号快拍档达人复工卖货忙
  “朋友们拼手速的时候到了,快抢啊”   “四件套我的最爱,都别跟我抢啊,给我留个”   “乳胶枕怎么没有了,求补货”   “我要买被子,快点快点”   “有没有婚庆床上...
日期:10-15
iPhone 14实测:信号更好 5G速度提升38%_iPhone 12 5G速度
苹果的iPhone 14系列手机已经上市,目前有机构测试了iPhone 14系列的信号问题,目前来看,一直受信号诟病的iPhone终于有改观了,现在iPhone 14及iPhone 14 Pro不一样了,5G网速提升了...
日期:09-26
因在澳大利亚收集位置数据,谷歌面临6000万美元罚款_谷歌澳大利亚案
讯 北京时间8月12日上午消息,据报道,谷歌因在澳大利亚收集位置数据将支付6000万美元罚款。智能汽车关键技术与设计方法酷派千元手机数字藏品拍卖欧拉新能源小型汽车宏光mini e...
日期:08-12
字节跳动多家公司已更名为抖音:新Logo上线_字节跳动公司就是抖音吗
今日消息,天眼查显示,今年5月以来,字节跳动旗下多家公司已陆续更名为抖音。其中字节跳动(香港)有限公司更名为抖音集团(香港)有限公司,字节跳动有限公司更名为抖音有限公司,北京字节...
日期:10-15
小米Redmi K60 Ultra已通过认证 性价比神机要来了!_红米k60pro尺寸
【手机中国新闻】近日,手机中国注意到,一款型号为“23078RKD5C”的智能手机产品已经正式通过了认证。 信息显示,这款手机的申请人和制造商均为小米通讯技术有限公司,而生产厂商...
日期:06-21
苹果6代「苹果6代平板多大尺寸」
近年来,随着科技的不断发展和更新,手机也变得越来越普及,成了我们日常生活不可缺少的一部分。而苹果公司推出的iPhone 6也成为了人们关注的焦点,更是备受期待的一部手机。iPhone...
日期:06-03
揪出Android手机电老虎!金山电池医生耗电应用排行
  同样两台Android手机,在同样正常使用的情况下,为什么一台能待机超过2天,另一台每天就必须充电一次?十一国庆长假来临,众多朋友外出旅游,如果玩兴正浓却发现手机没电不能联系...
日期:07-23
还我单机!玩家希望《暗黑4》出离线模式:排队、卡顿太烦人「暗黑4 ps4」
等了10多年,《暗黑4》最近终于开始测试了,游戏将在6月6日上市,上周末的开放公测吸引了上百万玩家参与,然而这也带来了服务器排队问题,对此玩家更希望《暗黑4》有离线模式。玩家都...
日期:03-27
还好没放弃!又一安卓厂商自研手机处理器即将大功告成:3nm加持_安卓主流处理器
快科技7月6日讯,谷歌把三星Exynos包装成Tensor处理器,类似地,微软把高通骁龙包装成SQ处理器。这样尝试过几代产品后,看起来至少谷歌已经决定有所改变。来自The Information的报...
日期:07-07
美国限制中企使用美国云服务的备选路径分析「美国云端服务商宕机」
7月4日美国《华尔街日报》报道,拜登政府拟出台新规,限制中国企业使用美国云计算服务。该规定将要求亚马逊、微软等美国云服务提供商在向中国客户提供使用先进AI芯片的云计算服...
日期:07-07
5g救护车的技术「印度推出首辆5G救护车 所有设备可在5G网络下运转」
  10 月 4 日消息,印度 10 月 1 日在印度移动大会上宣布正式推出 5G 服务,并将在年内提供给近 75% 的人群,第一阶段覆盖 13 城,2023 年底前推广全国。  据央视新闻报道,大...
日期:10-12
铠侠:今年是公司发明 NAND 闪存 35 周年,芯片容量从 4 Mb 增长到 1.33 Tb
  2 月 11 日消息,据 TechPowerUp 消息,铠侠美国公司今天宣布,2022 年是该公司发明 NAND 闪存 35 周年。   据报道,1987 年,NAND 闪存迎来了全新的技术时代,淘汰了之前使用...
日期:11-21