您的位置:首页 > 互联网

微软gpx「AI圈巨震!微软论文曝光GPT-3.5参数量仅有200亿」

发布时间:2023-10-31 23:31:22  来源:互联网     背景:

要点:

  • 微软论文爆料GPT-3.5的参数量仅为20B,远小于之前官方宣布的1750亿,引发广泛关注和争议。

  • 微软的论文介绍了一个小规模扩散模型CodeFusion,性能出色,只有7500万参数,与大型模型相媲美。

  • 论文讨论了CodeFusion模型的架构和性能表现,对GPT-3.5的真实参数量提出了质疑,但仍需等待官方开源数据揭晓。

10月31日 消息:最近,微软的一篇论文引发了广泛讨论,揭示了GPT-3.5的真实参数量可能只有20B,远远小于之前官方宣布的1750亿。这一曝料在AI圈内引起了巨大的震动,让人们开始重新评估这一庞大模型的性能和潜力。此论文还介绍了一个小型扩散模型CodeFusion,它只有7500万参数,但在性能方面与大型模型相媲美,引发了人们对模型规模与性能之间的关系的思考。

流星洛克人2 变身

CodeFusion是一个用于代码生成的模型,经过两个阶段的训练,使用无监督预训练和有监督微调的方法,不断提升其性能。在性能评估中,CodeFusion在top-1准确率方面表现出色,尤其在Python任务中,几乎与GPT-3(175B参数)相媲美。而在top-3和top-5设置下,CodeFusion明显优于其他基线模型。

羽毛球双十一活动

微软research intern

微软期刊

论文地址:https://arxiv.org/pdf/2310.17680.pdf

然而,最引人关注的是GPT-3.5的参数量。以前人们普遍认为它有1750亿参数,但这篇论文声称它只有20B。这个巨大的参数量差异引发了广泛的猜测和讨论。一些人认为这可能是作者的手误,但也有人认为这一参数估计是准确的,因为一些小型模型在性能上与GPT-3.5相媲美。此外,还有人提出了对GPT-3.5的性能和参数量进行更深入研究的问题,以更好地理解这一庞大模型。

尽管这一论文引发了许多争议,但我们仍需等待官方的数据披露以确定GPT-3.5的真实参数量。这个问题引发了关于模型规模与性能之间关系的深刻思考,以及对GPT-3.5是一个小专家模型的集成还是通才模型的质疑。这一争议仍在继续,只有等待更多信息的揭晓才能解开谜团。


返回网站首页

本文评论
央视:近七成晚睡是因为手机 睡前刷刷反而适得其反「睡前刷手机影响睡眠」
中关村在线消息:10月10日,央视网官方发布了一则有关“晚睡”的博文:现在困扰人们睡眠的头号难题是睡不着,而根据调查显示,近七成晚睡都与睡前刷手机有关,有很多用户都喜欢在睡觉前...
日期:10-14
新氧科技财报_新氧科技第二季度营收3.09亿元 同比下滑31.6%
查看最新行情   讯 北京时间8月16日晚间消息,医美O2O平台新氧科技(Nasdaq: SY)今日发布了截至6月30日的2022年第二季度财报。财报显示,新氧科技第二季度总...
日期:08-20
AMD rx6600_曝AMD RX6600 将于10月13日发布
  10 月 6 日消息 VideoCardz 现拿到了 AMD RDNA2 系列的下一款型号 Radeon RX 6600 的最终规格和性能数据。   据称,AMD Radeon RX 6600 将配备 1792 个流处理器,与 XT...
日期:07-17
热钱卷进手打柠檬茶,一斤香水柠檬从5元涨到30元
  文|韦雯;编辑|彭孝秋  来源:36氪  越来越多的人快“喝不起”柠檬茶了。  即使在大街小巷都遍布手打柠檬茶店的广东也不例外。事实上,想在广东喝一杯正宗的手打柠檬茶,...
日期:08-30
迈向车联网规模商用,天津河北区携手华为等产业伙伴联合发布商用示范及开放测试道路
通信世界网消息(CWW)2023年7月30日,由天津市工业和信息化局、天津市交通运输委员会、天津市交通管理局、天津市河北区人民政府和华为公司联合主办的“智汇天津·车联未来”车联...
日期:08-01
谷歌FTC和解:同意今后20年接受第三方隐私审查
  10月25日消息 据过外媒体报道,谷歌与美国联邦贸易委员会(Federal Trade Commission, 简称FTC)达成和解协议,同意在今后20年接受第三方隐私审查,和解有关谷歌滥用用户个人...
日期:07-24
Cutout.Pro:将静态照片转化为视频的AI神器 动态表情超逼真
8月1日 消息:Cutout.Pro是一款可以将静态照片转化为动态视频的产品,让照片变得更加生动有趣。无论是将旧照片转化成怀旧视频,还是为艺术品增添动感,这个产品都能带来不少惊喜。...
日期:08-01
oppo find7s「OPPO Find X7系列入网,采用双处理器,标配潜望长焦」
就在今日,OPPO Find X7系列两款机型已全部入网。Find X7系列标配100W的快充头,并采用双处理器策略——天玑9300和骁龙8 Gen 3。所有型号都配备了高品质潜望式长焦镜头和高密度...
日期:12-09
美股周三:特斯拉总结13连涨,英伟达涨逾4%,理想涨超7%「美股特斯拉大涨中国股市会怎么样」
6月15日消息,美国时间周三,美股收盘主要股指涨跌不一。此前,美联储宣布维持基准利率不变,但暗示货币紧缩周期尚未结束,今年仍有可能进一步加息。道琼斯指数收于33979.33点,下跌232...
日期:06-15
孟晚舟回国两周年之际 华为Mate 60发布会定档
9月14日上午9点,华为在官方多个社交账号发布消息,称将在9月25日下午2:30举行华为秋季全场景新品发布会。华为内部人士向第一财经记者确认了上述发布会包含了手机新品的发布信息...
日期:09-14
苹果官网全新页面“Apps by Apple”:开放侧载的预兆?_iphoneapp官网
近期,苹果公司在其官网上线了一个全新的页面,名为“Apps by Apple”。目前,这个页面主要是用来宣传和推广苹果自家开发的应用程序,包括Messages、Safari、iPad版的Final Cut Pro...
日期:09-06
首次搭载潜望镜头!iPhone 15 Pro Max零部件供应出问题:将推迟发货
快科技8月22日消息,多方消息均已明确,苹果将会在9月12日(北京时间9月13日凌晨)召开新品发布会,推出iPhone 15系列。华为p50有2k吗如今该系列机型已经开始投入量产,但在发布之前却...
日期:08-22
魅族19外观设计曝光 后置双单元难评价「魅族19会是全面屏吗」
中关村在线消息:近日,魅族19系列的渲染图被曝光,新机后置摄像头模组采用双环设计,但魅族19的双环为横向排列,正面屏幕为居中挖孔方案。魅族19系列的渲染图被曝光后,引起了网友的激...
日期:10-18
ebay美国的员工收入「eBay 宣布计划将裁员 500 人 约占员工总数的 4%」
2月8日消息:据eBay提交给美国证券交易委员会(SEC)的文件显示,eBay宣布计划裁员500人,约占其员工总数的4%。裁员未来24小时内通知受影响的员工。moto官网中国商城eBay 首席执行官...
日期:02-09
新西兰澳大利亚什么关系「新西兰和澳大利亚-率先发货国家」
来源:中关村在线苹果的iPhone 15系列手机于9月22日星期五正式开始发货。由于时区差异,新西兰和澳大利亚是最早收到iPhone 15系列、Apple Watch Series 9 和 AirPods USB-C版本...
日期:09-22
小米手机fast boot什么意思
Fastboot是一种用于Android设备的启动模式,它允许用户在设备未完全启动时对设备进行诊断和修改。Fastboot通常用于刷机或在设备上安装或卸载系统图像和其他软件。oppoa17是什...
日期:05-28
iPhone 14 Plus免税版开卖:能便宜289元「苹果13免税后多少钱」
今年苹果发布了4款iPhone 14系列手机,取消了mini型号,新增了iPhone 14 Plus这一型号,也是最晚开卖的系列,昨天才上市首销,售价6999元起,现在海南免税店版的iPhone 14 Plus也开卖了...
日期:10-09
保利威“竖屏带货”直播方案出炉,内嵌私域、1周上线!
  先来看“穆胜事务所”6月公布的3个数据—   1.在带货转化这个场景里,直播的进店转化率以及购买转化率都是图文的6.5倍,转化效率远高于图文和短视频;   2.据淘宝2019...
日期:07-14
香港恒生指数开盘涨0.33% 网易、京东集团涨超2%(港股开盘:恒生指数涨1.3%)
查看最新行情   讯 8月16日上午消息,香港恒生指数开盘涨0.33%,恒生科技指数涨0.72%。网易、京东集团涨超2%。美团涨超1%。 聚美优品和乐蜂网的口水战为...
日期:08-20
蔚来汽车顶配「蔚来汽车推出天穹车尾帐:适配 ES / EC 车型,预售 3999 元起」
IT之家 6 月 16 日消息,蔚来汽车推出天穹车尾帐,适配 ES / EC 车型全部车款,经典款售价 3999 元,黑胶款售价 4899 元,7 月 17 日发货,预订赠送户外露营灯。iqoo双十一价格IT之家从...
日期:06-17