您的位置:首页 > 互联网

最高20倍!压缩ChatGPT等模型文本提示,极大节省AI算力_最好的压缩算法

发布时间:2023-10-25 15:36:44  来源:互联网     背景:

声明:本文来自于微信公众号 AIGC开放社区(ID:AIGCOPEN),作者:AIGC开放社区,授权转载发布。

在长文本场景中,ChatGPT等大语言模型经常面临更高算力成本、更长的延迟以及更差的性能。为了解决这三大难题,微软开源了LongLLMLingua。

曝iphone14的缺点

据悉,LongLLMLingua的核心技术原理是将“文本提示”实现最高20倍的极限压缩,同时又可以准确评估提示中内容与问题的相关程度,消除无关内容保留关键信息,达到降本增效目的。

实验结果显示,经过LongLLMLingua压缩后的提示,比原始提示的性能提升了17.1%,同时输入GPT-3.5-Turbo的tokens减少了4倍。在LongBench和ZeroScrolls测试中显示,每1,000个样本节省28.5美元和27.4美元的成本。

当压缩约10k tokens的提示,压缩率在2-10倍范围内时,端到端延迟可以降低1.4-3.8倍,显著加速了推理速率。

论文地址:https://arxiv.org/abs/2310.06839

开源地址:https://github.com/microsoft/LLMLingua

从介绍论文来看,LongLLMLingua主要由问题感知的粗细粒度压缩、文档重排序、动态压缩比率和压缩后子序列恢复4大模块组成。

问题感知的粗粒度压缩模块

该模块的设计思路是,使用问题文本进行条件化,评估每个段落与问题的相关程度,保留相关度更高的段落。

具体来说,通过计算问题文本与各段落的条件困惑度,判断二者的逻辑关联程度,条件困惑度越低表示相关性越高。

在此基础上,设置阈值保留困惑度较低的段落,过滤掉与问题不相关的段落。这实现了根据问题快速移除大量冗余信息的粗粒度压缩。

文档重排序模块

压缩算法

研究表明,在提示中,靠近开始和结束位置的内容对语言模型的影响最大。所以该模块根据各段落的相关程度对其进行重新排序,使关键信息出现在对模型更敏感的位置,减少中间位置信息损失。

通过利用粗粒度压缩模块计算出的各段落与问题的关联度,对段落进行排序,使关联度最高的段落排在最前面。这进一步增强了模型对关键信息的感知。

ios14.4续航掉电

高效压缩算法

在获取重排序后的相关段落后,需要进一步压缩每个段落内的词量。此时动态压缩比率模块对提示进行精细调控。

动态压缩比率模块

苹果怎么了? 分析称国内用户对iPhone的忠诚度降低了

对更相关的段落使用更低的压缩比率,分配更多的保留词语预算,而对相关性较弱的段落则使用更高的压缩比率。

通过利用粗粒度压缩结果中的段落关联度,动态确定每个段落的压缩比率。关联度最高的段落压缩比率最低,依次类推。

压缩算法

实现自适应、细粒度的压缩控制,有效保留关键信息。压缩后还需要提高结果的可靠性,这就需要下面的压缩后子序列恢复模块。

压缩后子序列恢复模块

在压缩过程中,一些关键词可能被过度删除,影响信息的完整性,而该模块可以检测并恢复这些关键词。

工作原理是,利用源文本、压缩文本、生成文本之间的子序列关系,从生成结果中恢复完整的关键名词词组,修复压缩带来的信息缺失,提高结果的准确性。

整个过程有点像我们快速浏览文章、筛选信息、整合要点的工作流程等,使模型快速捕捉文本的关键信息,生成高质量的摘要。

LongLLMLingua实验数据

国美零售黄光裕最新消息

研究人员构建了一个基于Natural Questions的多文档问答数据集,其中每个示例包含一个问题及20个相关文档,并需要从这20个文档中查找到答案。

该数据集模拟了实际的搜索引擎和问答场景,可以评估模型在长文档中的问答性能。

此外,研究人员还采用了更为通用的长文本理解基准测试集,包括LongBench和ZeroSCROLLS,以评估方法在更广泛场景下的效果。

其中,LongBench覆盖单文档问答、多文档问答、文本摘要、少样本学习等任务,包含英文数据集。ZeroSCROLLS则包括文本摘要、问答理解、情感分析等典型语言理解任务。

在这些数据集上,研究人员比较了LongLLMLingua压缩后的提示与原始提示在大语言模型上的性能。同时,也与其他提示压缩方法进行了对比,如基于困惑度的LLMLingua和基于检索的方法,评估了LongLLMLingua的有效性。

实验结果显示,LongLLMLingua压缩后的提示在问答准确率、生成文本质量等指标上普遍优于原始提示。

例如,在NaturalQuestions上,压缩4倍的提示提升了17.1%的问答准确率。当压缩约10k tokens的提示,压缩率在2-10倍范围内时,端到端延迟可以降低1.4-3.8倍。这充分证明LongLLMLingua可以在压缩提示的同时提升关键信息提取。


返回网站首页

本文评论
OPPO Find N3要用!OPPO索尼合作推出双层晶体管像素技术
9月12日消息,索尼半导体今日官宣,旗下光喻 LYTIA 图像传感器品牌与OPPO合作,联合推出拥有双层晶体管像素技术的LYTIA图像传感器。据了解,索尼半导体早在2021年就推出双层晶体管...
日期:09-12
60种电信网络诈骗手段,2018年,别再上当!「“引流”成电信网络诈骗主流手段?  北京移动教你如何防范!」
通信世界网消息(CWW)今年以来,境外涉诈引流短信呈高发态势;仅4月期间,中国移动北京公司(北京移动)就收到用户举报1500余件,内容都是关于来自境外号码发送的垃圾短信。鉴于此,5月起北...
日期:08-22
传谷歌Google+将于11月向游戏开发者开放API_谷歌云游戏服务公布上线信息:11月上线
  据美国科技博客网站Silicon Alley Insider(SAI)报道,知情人士今天透露,谷歌Google+社交网络服务有望从今年11月开始大规模向游戏开发者开放API(应用编程接口)。谷歌上月...
日期:07-23
苹果CFO:本财季营收下滑是受汇率影响 库克称自己每天都用Vision Pro_苹果ceo库克年收入
8月4日消息,当地时间周四苹果发布截至今年7月1日的2023财年第三财季(2023年第二季度)财报。财报显示,苹果第三财季营收为818亿美元,同比下滑1%;净利润为199亿美元,同比增2%。财报发...
日期:08-04
抖音卖教材「抖音卖儿童教辅,热销10万+」
声明:本文来自于微信公众号 十里村(ID:shilipxl),作者:村长住在十里村,授权转载发布。各位村民好,我是村长。在抖音卖儿童教辅产品,也能赚到钱,关键是普通人也能入局。最近身边有朋...
日期:08-03
泛微oa系统客服_泛微OA系统为大型制造业打造内外一体的移动报修平台
  泛微OA系统结合大型制造业的实际需求,部署了内外一体的移动报修平台,提供一套完整的内部自修以及外包维修提供一体化管理解决方案…   对于大型制造企业来说,设备是公...
日期:07-14
小鹏汽车: 1月共交付汽车5218台「小鹏汽车12月22日」
2 月 1 日讯:今日,小鹏汽车公布 1 月交付成绩称,由于春节期间部分交付推迟, 2023 年 1 月小鹏汽车共交付5, 218 台,其中G9 交付2, 249 台。手机直面屏和曲面屏的优缺点...
日期:02-01
华硕推出碳合作伙伴服务,多款新产品助力企业可持续发展_华硕联合科技股份有限公司
近日,华硕在 2023 年Computex国际电脑展( Computex 2023 )上推出华硕碳合作伙伴服务,支持企业实现自己的可持续发展目标。客户通过购买华硕产品,在“碳合作伙伴服务”框架下,可以...
日期:06-08
美股周五:三大股指连跌三周,英伟达再跌逾2%,拼多多5天涨25%_美三大股指收涨 拼多多再创新高
美国时间周五,美股收盘主要股指全线下跌,三大股指本周均下跌3%以上,且连续第三周下跌。此前美国公布了8月非农就业数据,并未改变美联储将在9月底大幅加息的预期。直播蹭流量道琼...
日期:09-24
椰树集团回应直播争议;市监局回应消费930.9元遭反向抹零;上海迪士尼暂停部分景点和演出
文章目录 椰树集团回应直播争议 市监局回应消费930.9元遭反向抹零 上海迪士尼暂停部分景点和演出 椰树集团回应直播争议据红星新闻报道,针对“直播带货风格引发网友争议”的...
日期:10-09
小米13S无了-雷军_小米13没有计划做半代升级版本_小米13.3
去年7月,小米12S系列发布,带来小米12S、小米12S Pro、小米12S Ultra三款机型,通过与徕卡的联合,打造了顶级的影像系统,在手机行业,甚至是摄影圈都收获了不错的口碑。其中,小米12S U...
日期:09-19
苹果生成式 AI「Apple GPT」或明年推出 首先应用于 Siri 和 AppleCare_iso生成器
7月24日消息:苹果公司正参与生成式人工智能的竞争。上周,Mark Gurman 报道了苹果公司的一项重大进展:目前,苹果公司正在全力研发大型语言模型(LLM),并计划最早于明年推出一款生成...
日期:07-24
SRS庆祝与微软Windows Media Player合作10周年
  (联合电讯社/加利福尼亚州)--2010年5月17日--环绕声、音频及语音处理技术行业领军SRS实验室(纳斯达克股票代码:SRSL)今日宣布,2010年5月迎来了SRS WOW?进驻微软视窗媒体播...
日期:07-29
快手举报违法违规会怎么处理「快手9月受理侵权举报1221条 相比8月下降25%」
10月10日 消息:日前,快手发布了2022年9月侵权举报受理及处置情况的通知,9月共受理侵权举报1221条。快手表示,为进一步展现平台对于网络侵权行为的“零容忍”态度,严格落实企业主...
日期:10-28
微信朋友圈如何修改可见范围「微信内测朋友圈可见范围二次修改」
  财联社8月24日电,近日,有网友发现苹果用户的微信朋友圈可以修改可见范围。具体操作步骤为:iPhone用户更新微信至最新版,点击一条自己的朋友圈,点击右上方三个灰色的点,会出现...
日期:09-07
德电CTO Abdu Mudesir:实现自智网络是德电的长期目标「德电能源科技有限公司」
通信世界网消息(CWW)近日,在德国电信的Telekom Campus Fair2023 活动中,德电CTO Abdu Mudesir表示,实现自智网络是德电的长期目标,也是Telekom平台战略不可或缺的一部分,自智网络...
日期:08-02
CMMLU中文向排名第一!快手自研AI也来了「快手十大mcn」
近一段时间,国内生成式人工智能模型的推出可谓是你方唱罢我登台,好不热闹。诺基亚8.3屏幕供应商快科技8月21日消息,近日,快手的自研大模型快意”(KuaiYii)已经出现在了AI综合中文...
日期:08-21
雷军2023准备了3份建议案:2份都是关于汽车_听说雷军要造车了是真的吗
近日正值大会期间,雷军作为全国人大代表,今年准备了3份建议案,分别关于仿生人形机器人、汽车信息安全和汽车文化等。中国建成5G基站71万个?雷军此前就曾介绍,现在自己1/2的时间...
日期:03-04
祝贺!杨璋胜董事长获评“2022十大渝商”称号_渝丰杨璋胜是哪里人
近日,“2022十大渝商评选活动”专家评审会议在重庆日报报业集团召开,渝丰科技股份有限公司董事长杨璋胜获评“2022十大渝商”称号。诺基亚后置5个摄像头弘扬传承爱国精神,助推...
日期:04-30
文章配图用明星照片,赔了80万!要注意什么?_文章配图用明星照片,赔了80万!要注意什么呢
本文转载自运营公举小磊磊(公众号ID:gongjulei),免费阅读200万字新媒体运营知识,提升新媒体运营能力。大家都知道,写文章配图不能乱用明星照片,一不小心就可能侵犯肖像权,遭到明星...
日期:10-09