您的位置:首页 > 互联网

研究人员推出压缩框架QMoE:可将1.6万亿参数模型高效压缩20倍_压缩技术洛谷

发布时间:2023-11-01 01:51:26  来源:互联网     背景:

要点:

1. ISTA的研究人员提出了QMoE模型量化方法,可以将1.6万亿参数的SwitchTransformer压缩至160GB以下,每参数仅0.8位,实现了高达20倍的压缩率。

2. 这种压缩框架通过专门设计的GPU解码内核实现,能在一天内将庞大的模型压缩至适用于4张英伟达RTX A6000或8张英伟达RTX3090GPU的大小,而开销不到未压缩模型的5%。

3. QMoE采用了数据依赖的量化方法,实现了高效的压缩,即使在极低位宽下,仍能维持准确性,适用于大规模的混合专家架构模型。

10月31日 消息:最新研究来自ISTA的科学家提出了一种创新的模型量化方法,称为QMoE,可以将庞大的1.6万亿参数SwitchTransformer压缩到令人难以置信的160GB以下,每个参数仅占用0.8位。这一方法实现了高达20倍的压缩率,为解决大型模型的高昂成本和内存需求问题提供了新的解决方案。

GPT-4等大型模型的发展使混合专家架构(MoE)成为研究的焦点。虽然MoE可以显著提高模型的准确性和训练速度,但由于庞大的参数数量,需要大量的显存才能运行这些模型。例如,1.6万亿参数的SwitchTransformer-c2048模型需要3.2TB的GPU显存。为解决这一问题,ISTA的研究人员提出了QMoE,这一框架利用专门设计的GPU解码内核,实现了高效的端到端压缩推理。

压缩技术

原启生物招聘

压缩模块

当贝投影仪d1和极米Z6X

论文地址:https://arxiv.org/pdf/2310.16795.pdf

QMoE的独特之处在于采用了数据依赖的量化方法,允许在底层的位宽下实现高度压缩,同时仍能维持准确性。实验结果表明,即使在仅有2位或三元精度的情况下,与未压缩模型相比,精度的损失非常小。这一研究的成果为大规模混合专家架构模型的高效压缩和执行提供了新的可能性,将其适用于消费级GPU服务器,减少了内存开销,并降低了运行成本。

尤其令人印象深刻的是,QMoE的高效性,小型模型甚至可以在一小时内完成压缩,而大型模型如c2048也只需要不到一天的时间。虽然在执行速度方面与未压缩模型相比略有下降,但这一方法在大规模模型的压缩方面具有重要潜力。总的来说,QMoE为解决大型模型的内存需求问题提供了创新的解决方案,实现了高度的压缩和高效的执行。

vivo x70天玑1200

然而,这项研究也存在一些局限性,因为目前公开可获得的大规模精确MoE模型数量有限,因此需要更多的研究和实验来进一步验证其适用性。这一创新性研究将有望为未来的深度学习和大型模型研究开辟新的方向。


返回网站首页

本文评论
女生应聘被问是否单身!当事公司:要求单身正常 将起诉举报者_面试被问是否单身
今日消息,据九派新闻报道,广东东莞的任女士应聘行政岗,HR问任女士是否单身。任女士表示第一次遇见这种事,感觉很奇怪很离谱,之后举报了该公司,该公司已下架。没想到的是,该事件被曝...
日期:02-09
腾讯减持1000亿「腾讯股东一个月减持7980万股  投资20年赚超7000倍」
11月25日 消息:虽然腾讯股价已反弹近40%,但依然面临着被南非大股东减持的压力。11月24日,腾讯大股东Naspers集团荷兰子公司Prosus发布最新资产概况显示,相比10月28日和11月23日...
日期:12-04
作业帮王岩:在线教育优势之一是将教学过程最大程度数字化
  “在线教育的一大优势就是将教学过程最大程度的数字化,这样大量的创新科技都可以通过数字化的方式接入到其中,发挥线下难以做到的效果。”近日,在第十二届哈佛中国教育...
日期:04-23
美团二季度营收437.6亿「美团2022年第二季度营收509.4亿元 调整后净利润20.6亿元」
查看最新行情   讯 8月26日下午消息,美团今日发布2022年第二季度财报,财报显示,该公司第二季度营收509.4亿元,同比增长16.4%。净亏损11.2亿元,同比收窄67%...
日期:08-27
四成企业屏蔽社交网站 谁来拯救“微博控”
  “微博控”的微博狂欢派对正面临“失控”。   上班期间无时不刻挂在微博上,每隔几十分钟就要去看一次——微博控的这种严重影响工作效率的行为让企业的老板们再也看不...
日期:07-27
跟美的、海尔比,格力真是掉队了_海尔不如美的和格力了
作者|Eastland京东限量秒杀头图|视觉中国在国内外多重不利因素作用下,经济增长放缓、居民对未来收入的信心不足,社会消费总额下降。由于购买家电不是刚需(冰箱、洗衣机、电视机只...
日期:09-25
花花是顶流吗「女顶流“花花”提前休五一 网友:这待遇真不错」
五一假期即将到来,成都大熊猫繁育研究基地的游客络绎不绝,前来一睹可爱的大熊猫们的风采。有保安大叔在门口喊话,提醒游客们花花休息了,接替它值班的是和叶,游客们可以前往进行参...
日期:04-28
京东据悉计划于3月初启动百亿补贴活动_2021年京东百亿补贴活动多长时间
  2月20日,《南华早报》援引知情人士报道称,京东计划在3月初推出100亿元人民币(约合15亿美元)的补贴活动,与经济型购物应用拼多多展开竞争。漂亮的容颜和有趣的灵魂  据悉补...
日期:03-01
张雪峰:报志愿不要听网红忽悠 坚持理性和个性
张雪峰老师在最近的一篇文章中提醒大家在报志愿时不要被社交媒体上的网红忽悠,而是要理性慎重地选择专业。他指出每个专业都有独特的价值,如果大家都只追随热门专业,可能会导致...
日期:08-21
微软商店win10专业版_微软 Win11 全新应用商店 App 正面向 Win10 预览版推送
  10 月 27 日消息,据 MSPoweruser 报道,Windows 10 内测人士可能已注意到,有一个商店应用程序的更新。微软正在向 Windows 10 用户推出新的 Windows 11 应用商店,这一事实得...
日期:07-17
苹果Apple Music古典乐App国内上线:无广告、无需额外付费_apple music 古典
快科技1月24日消息,日前,苹果专为古典音乐设计的独立应用Apple Music古典乐正式在国区App Store上架。如果你是Apple Music订阅用户,无需额外付费即可聆听高质量的古典音乐。Ap...
日期:01-26
OpenAI API Cost Calculator官网体验入口 OpenAI API成本计算器在线使用地址_api计费系统源码
OpenAI API Cost Calculator是一个免费工具,用于评估不同OpenAI API模型的使用成本,包括GPT-4、GPT-3.5 Turbo、不同fine-tuning模型以及图像和音频处理模型。点击前往OpenAI...
日期:01-09
番茄口袋那些事儿_番茄口袋有几家店
  —— 好物聚集,为你而来!   01. 番茄口袋是谁?   番茄口袋是一家精选全球好物的全品类新零售平台。线下的“番茄市集”将购物体验和社交休闲融为一体;而线上的“口...
日期:04-21
马斯克已经掌管推特公司:希望其成为“最受尊敬的广告平台”「推特马斯特」
10月28日消息,据国外媒体报道,推特原CEO已经离开公司总部,马斯克已经掌管社交媒体推特公司,并已经开始规划这家社交媒体平台的未来。据悉,10月27日,马斯克在推特上做出承诺,表示在...
日期:10-29
小米14相机「新自拍神器?曝小米14系列将配备4K录制前置镜头」
近日,海外博主Kartikey Singh透露,小米14系列将解决小米13系列在自拍和USB接口方面的短板。据他称,小米14系列将首次搭载可录制4K视频的前置摄像头以提升自拍体验,而且小米13 Ul...
日期:06-08
疯狂小杨哥是做什么工作的「疯狂小杨哥等五位网红主播被点名 涉及虚假广告、产品质量问题」
一份分析消费者对直播电商情绪的报告发现,14位热门主播中有5位的相关讨论量超过90%。其中,涉及“疯狂小杨哥”的维权舆情最多,占比达29.27%;其次是李佳琦,占比28.49%;刘畊宏排第...
日期:04-24
共享雨伞会是下一个共享单车?还是未知数_伞掉在共享单车
  (原标题:从低调潜伏到百亿级市场,共享雨伞还有没有戏?)   文 | 王新喜   在共享经济领域,我们会发现,共享单车凉了之后,共享充电宝、迷你KTV、共享按摩椅甚至共享雨伞...
日期:11-25
pico neo vr一体机「PICO 4 VR一体机新品发布:售价2499元起 将推VR版《三体》」
9月27日消息,PICO在中国市场正式发布新一代VR一体机——PICO 4系列,售价2499元起。这是PICO被字节跳动收购以来首次发布升级换代产品。据悉,PICO 4产品配置达到行业领先水平。...
日期:09-28
一级b跟一级的区别「B站新设动画、影娱、纪录片一级部门」
8月22日 消息:据晚点 LatePost消息,近日 B 站分拆了 OGV (专业机构创作视频)事业部。该部门主要负责 B 站的动漫、影视、综艺、纪录片等专业内容运营。美国facebook公司简介一...
日期:08-22
金山装机精灵新增系统重置功能 成网友首款必装软件
  5月3日,金山网络今日正式推出装机精灵1.0版。该产品定位于基础装机服务,可一键式、一站式地为普通电脑用户解决重装系统、安装驱动、还原数据等常见难题。金山装机精灵由...
日期:07-27