您的位置:首页 > 互联网

微软开发新型大模型压缩方法SliceGPT_模型压缩综述

发布时间:2024-01-29 19:47:57  来源:互联网     背景:

1月29日 消息:SliceGPT是微软开发的一种新型的大语言模型压缩方法。通过SLICE GPT,可以在保持99%,99%,和90%零样本任务性能的同时,将LLAMA2-70B、OPT66B和Phi-2模型分别去除高达25%的模型参数(包括嵌入)。

微软模型2020

这意味着使用SLICE GPT的模型可以在更少的GPU上运行,并且运行速度更快,无需任何额外的代码优化。在24GB的消费级GPU上,将LLAMA2-70B的总计算量减少到密集模型的64%;在40GB的A100GPU上减少到66%。

iphone se评价

模型压缩技术

论文地址:https://arxiv.org/pdf/2401.15024.pdf

3d模型压缩算法

SLICE GPT的主要特点包括解决了大语言模型在存储和计算资源上的高需求问题,并提供了一种有效减轻这些资源需求的方法,同时保持或仅轻微牺牲模型性能,这对于推广大型模型的应用和降低运行成本具有重要意义。

具体来说,SLICE GPT能够减少大型语言模型的尺寸,通过在不损失显著性能的前提下,减少模型参数数量,SLICE GPT能够减少大型语言模型的尺寸。它还能提高模型在硬件上的运行效率,减少了所需的计算资源,并且能够在去除一定比例的模型参数的同时,保持模型的性能。此外,SLICE GPT不仅适用于特定的模型或架构,它的方法可以广泛应用于各种变换器网络模型。

SLICE GPT的工作原理基于一种新的后训练稀疏化方案,通过两个关键步骤来减少大型语言模型的计算和内存需求。首先是替换权重矩阵,通过将模型中的每个权重矩阵替换为一个更小的(密集的)矩阵来减少网络的嵌入维度,有效地缩减了模型的大小。

其次是维持计算不变性,SLICE GPT引入了变换器网络中的“计算不变性”概念,通过特定的变换操作,改变权重矩阵的形状,而不改变其在模型中的功能和影响,从而达到减少模型参数的目的,同时保持模型的性能。这种方法的核心优势在于,它允许模型在去除一定比例的参数后,仍然能够保持接近原始模型的性能,适用于资源受限的设备上部署大型模型,比如普通的个人电脑或者移动设备。


返回网站首页

本文评论
倒在2023年的78款游戏:一半是二次元,近半数上线不到两年_2034年游戏
声明:本文来自于微信公众号游戏新知(ID:youxixinzhi),作者:夜风,授权转载发布。又到了年终总结的时候。2023年,似乎是头部产品星光闪耀、腰部产品血流成河的一年。我们能回想起许...
日期:01-26
铁路12306系统今日开启大升级:可短信/微信推送通知 非购票人也能收到
快科技8月22日消息,据中国铁路官方公众号通报,自8月22日起,铁路部门进一步优化完善12306旅客信息服务功能。将提供覆盖购票、乘车、退票改签、停运通知、晚点提示等出行信息服...
日期:08-22
Wild2Avatar官网体验入口 AI图像处理工具软件app免费下载地址
Wild2Avatar是一种用于渲染被遮挡的野外单目视频中的人类外观的神经渲染方法。它能够在真实场景下渲染人类,即使存在障碍物阻挡相机视野并导致部分遮挡。该方法通过将场景分...
日期:01-05
妈妈带高考结束女儿整容 当事人:不要盲目去跟风
6月22日消息,辽宁铁岭一位妈妈带着高考结束的女儿去整容。孩子妈妈冯女士介绍,女儿上了高中后特别喜欢玩游戏,自己和孩子爸爸就考虑是不是因为女儿长得不好看,不自信。为了不让...
日期:06-22
核心国际联手江大国际集团控股,共同打造国际化百事花旗SMPPT产品
     2021年6月17日,江大国际生物科技(广州)有限公司(以下简称江大国际)与广州核心国际生物科技有限公司(以下简称核心国际)的战略合作签约仪式在广州顺利举行,双方一致...
日期:11-21
一二折的网售图书,是正品吗?_一二折的网售图书,是正品吗广东
  来源:法治日报  前不久,山东吴女士在某电商平台的一家图书专营店购买了两套儿童分级读物《小羊上山》,每套价格为327元。当时商家宣称该书绝对正品,品质有保障,可放心购买...
日期:08-27
抖音本地生活启动“心动观赛季”营销活动「抖音策划活动」
10月9日 消息:昨日,抖音生活服务宣布,2022世界杯将至,平台将启动心动观赛季活动,联合全国万家优质商家,覆盖餐饮、酒旅、休娱等全品类生活服务领域,以多矩阵新颖的玩法,超优质资源...
日期:10-22
这颗小行星可能在159年后撞上地球?
(原标题:这颗小行星可能在159年后撞上地球?碰撞威力相当于22颗原子弹的爆炸能量,NASA:发生的概率仅为0.037%) 每经编辑 杜宇据科技...
日期:09-21
60万粉丝女网红偷平价睡衣被抓:真相大跌眼镜
近日,上海,一女子盗窃睡衣、化妆品等物品被抓,结果还是个小网红。监控视频显示,该女子在某商场内假装挑选衣服,偷偷将一件睡衣塞入衣服内,准备偷走。被工作人员发现后,女子谎称上厕...
日期:12-22
华为李鹏:中国5G必将从一步领先,到步步领先_华为5g走向世界
通信世界网消息(CWW)6月4日,在第31届中国国际信息通信展开幕论坛上,华为高级副总裁、运营商BG总裁李鹏发表《5G+AI持续创新,拥抱数智经济新时代》的演讲。他提到,在5G+AI的新时代,...
日期:06-04
老铁们急了!辛巴叫阵刘畊宏,短视频电商大战正酣
图源:图虫创意  来源: 时代财经  文/徐晓倩  头部主播辛巴翻出了一则陈年旧事。居然之家家居连锁集团  8月30日,其在抖音开播40分钟,控诉抖音平台。直播中,辛巴主动提及...
日期:09-01
《极品飞车》开发商“最强”游戏主机Mad Box外观公布_极品飞车ngc
  IT之家1月5日消息 不久前,《极品飞车:变速》和《赛车计划》系列的开发者Slightly Mad工作室,宣布了他们计划开发一款新的游戏机,称这将是“ 有史以来最强大的游戏机”,将于...
日期:03-22
餐厅回应给餐具穿“内增高”:觉得汤少可以要求添加_餐厅用的餐具
8月9日消息,一男子在某餐厅点了份12元一碗的汤,等汤端上桌,男子发现汤碗暗藏玄机。外表看着正常的餐具,其实深度连勺子都插不进去。网友表示:这汤碗是垫了内增高吗?对此,店员表示,正...
日期:08-09
OpenAI 的 GPT-4 变得「懒惰」和「愚蠢」:或被 MoE 彻底重塑导致性能下降
7月13日消息:世界上最强大的人工智能模型似乎变得不那么强大了。这让业内人士开始谈论可能会对该系统进行重大重新设计。最近几周,OpenAI 的 GPT-4 的用户们纷纷抱怨性能下降...
日期:07-13
国际电信联盟4g标准「国际电信联盟推动6G移动通信技术IMT-2030的发展」
据国际电信联盟(ITU)网站近日新闻,ITU发布了第六代移动通信系统(6G)标准和无线接口技术框架,为下一代移动通信发展奠定了基础。ITU无线电通信全会(RA-23)批准了关于“IMT-2030框架”...
日期:01-17
vivoy31s天玑700「vivo S17 Pro现身Geekbench:天玑7200处理器」
快科技4月24日消息,vivo一款型号为V2285A的新机出现在Geekbench跑分网站上,预计为vivo S17 Pro。据悉,vivo S17 Pro单核跑分为873分,多核跑分为2350分,从跑分情况来看,该机预计搭...
日期:04-25
折叠屏:手机市场的强心剂还是长生果?
  2019年的MWC是非凡的,用NBA的概念来说,这是一个“选秀大年”。今年的高顺位新秀分别有“5G”、“消费类IoT”、“折叠屏”等,这几名新秀或将改变未来几年互联网行业的发展...
日期:07-03
淘宝或推“暑期特别版”:Logo从橙色变蓝色「淘宝 橙色」
7月5日消息,近日,有消息称,淘宝将更换LOGO颜色,主色调将从橙色变为蓝色。据悉,蓝色LOGO为暑假特别版淘宝,蓝色版本或将在暑假晚间上线,淘宝端内板块也将有相应调整。据爆料,新版本将...
日期:07-05
《古墓丽影》新作有消息了!全力开发 今年公布_古墓丽影有新作吗
作为游戏业界最知名的作品之一,《古墓丽影》全系列总销量现已接近1亿份,该系列12部正统作品和多部衍生作品。vivo最强旗舰手机据知情人士透露,研发《古墓丽影》新作的Crystal D...
日期:01-22
美光科技:2022 Q1 财季营收 76.87 亿美元,环比下降 7%(美光财报2020)
  1 月 7 日消息,1 月 6 日,美光科技发布 2022 财年第一季度(2021 年 9 月 3 日-2022 年 12 月 2 日)财务报告。   根据报告,2022 财年第一季度营业收入 76.87 亿美元(约...
日期:07-17