您的位置:首页 > 互联网

华人团队推出Medusa简单框架 可将LLM推理速度提高2倍

发布时间:2023-09-13 13:39:32  来源:互联网     背景:

9月13日 消息:来自普林斯顿、UIUC等机构的华人团队提出一个用于加速大型语言模型(LLM)推理速度的简单框架Medusa,并于9月12日开源发布。测试结果显示,Medusa可以将LLM的生成效率提高约2倍。

Medusa是一个简单的框架,它让大家也可以使用多解码头技术来加速大型语言模型的生成。目前,许多热门的加速技术如speculative decoding都存在一些痛点,比如需要一个不错的draft模型作为基础,系统复杂度高,采样生成时效率不高等。

项目地址:https://github.com/FasterDecoding/Medusa

Medusa的方法是在原有的语言模型上增加额外的“解码头”,让每个头同时预测多个可能的未来词元。在使用Medusa增强模型时,原有的模型保持不变,仅新增的解码头在训练中进行微调。生成时,这些头并行产生多个可能的词,然后通过一种基于树的attention机制合并处理,最后使用一般的采纳策略从候选中挑选出最长的可信前缀进行解码。

研究人员通过以下几点设计,来解决speculative decoding存在的问题:

1) 不引入新的模型,仅在原模型上新增解码头,训练时参数效率高。

2) 生成时不需要严格匹配原模型的分布,使非贪婪生成甚至比贪婪解码还快。

第一个版本主要优化了每个batch只有一个样例的场景,也就是本地机器上常见的使用方式。在这种配置下,Medusa可以为Vicuna系列模型带来约2倍的加速。研究人员称正在积极扩展Medusa的应用场景,集成到更多的推理框架中,以获得更高的性能提升。

Medusa核心功能:

- 在现有语言模型上增加多解码头

泰捷和当贝机顶盒哪个更好

乐视的模式:互联网技术真正让生态创新变成可能

共享相簿取消会删照片嘛

- 高效训练参数

- 生成时树形attention机制合并多个预测

- 非贪婪生成模式下实现更快速度

zen3单核性能为什么强


返回网站首页

本文评论
沉寂两年后:华为“盘古”AI大模型即将上线「华为盘古大模型是什么东西」
2021年4月,刚刚接任华为云CEO的余承东在HDC华为开发者大会上公布了一项重磅产品:华为云盘古系列AI大数据模型。遗憾的是,虽然在大会结束后,盘古一度成为了从业者与网友讨论的焦...
日期:03-27
雷军:小米手机端侧大模型可媲美云端运算能力「miui侧边」
8月14日消息,今晚2023雷军年度演讲在北京举办。在演讲中,雷军提到小米全面拥抱大模型,小爱同学已经开始升级大模型。雷军表示,在AI方面,小米已经有了7年的研发历史,从2016年组建第...
日期:08-14
创新驱动未来,一文看懂数博会上的MAXHUB
  自数博会首次开办5年来,数博会逐渐成为一个展示大数据创新成果、聚焦大数据前沿话题、对话大数据行业领袖的国际性盛会和世界级平台。每年5月,业界玩家纷纷聚首贵阳,共襄...
日期:02-20
旅游消费强劲复苏,年轻人出游只重“吃”和“爽”?|2023旅游消费内容研究报告
声明:本文来自于微信公众号 TopKlout克劳锐(ID:TopKlout),作者:TopKlout克劳锐,授权转载发布。过去两年,在疫情影响下,我国的旅游市场经历了前所未有的冲击与挑战。2011-2019年间,...
日期:02-22
iphone刘海屏适配「保留刘海“凹槽” 消息称iPhone SE 4采用6.1英寸LCD显示屏」
据DSCC分析师Ross Young称,苹果iPhone SE 4将采用6.1英寸LCD显示屏,并在显示屏顶部保留刘海“凹槽”。不过,其凹槽是否会像其他iPhone机型一样包含TrueDepth摄像头阵列,以方便使...
日期:10-16
魅族20t「魅族20上架:预约量超10万单」
今天魅族官宣,魅族20系列手机已经开始新机的预约了,预约用户可以享受7项首发权益,而就在刚刚魅族宣布,仅7小时魅族20的超前预订的订单数就突破了10万。用户即可享受包括新机36个...
日期:02-22
《盗墓笔记》后传!网剧《藏海花》获发行许可:南派三叔总编剧
近几年,《盗墓笔记》小说逐渐影视化,2022年2月8日,《盗墓笔记》网剧《藏海花》在横店开机,担任总编剧的原著作者南派三叔现身开机仪式现场。一年多过去了,《藏海花》什么时候开播...
日期:07-19
微软的投资「微软投资 OpenAI 每年带来 300 亿美元营收 其中大约一半来自 Azure」
4月10日消息:微软已向人工智能初创企业 OpenAI 投资累计 130 亿美元,使 OpenAI 的估值达到近 300 亿美元,这笔投资带来了巨大潜力和不确定性。微软不仅向 OpenAI 直接投入资金...
日期:04-10
小米手机怎样省电_苹果手机怎样更省电
小米手机作为一款优秀的智能手机,凭借着其良好的性能和稳定的系统获得了众多用户的喜爱。然而,随着使用时间的增长,很多小米手机用户都会发现电池续航能力下降较快。为此,本文将...
日期:06-05
复联6推迟上映!现用手机能看《复联5》_复联5什么时候上映中国
中关村在线消息:10月12日,漫威新片《复仇者联盟6》宣布档期推迟,从原定的2025年11月7日变为2026年5月1日北美上映,晚了半年,离现在还有近4年。《复联6》的编剧为《洛基》《奇异博...
日期:10-18
浪潮集团一举中标,共建医院信息化_网易科技_浪潮科技园中标
(原标题:浪潮集团一举中标,共建医院信息化) 近日 浪潮集团有限公司在【高技术医院信息化采购项目】公开招标中一举中标。 浪潮...
日期:09-01
金秋阳澄湖大闸蟹淘宝商城首发 千人试吃明白消费(网购阳澄湖大闸蟹)
9月16日,苏州市相城区阳澄湖生态休闲旅游度假区鞭炮齐鸣、鼓乐声声。二十艘渔船一字排开,渔民们身着水乡服饰,唱着嘹亮的渔歌起航捕捞。这是占整个阳澄湖水域面积达70%的相城...
日期:07-23
维珍银河和马斯克「发射6枚火箭后 马斯克SpaceX的劲敌维珍轨道倒了:已申请破产」
在宣布裁员85%(约合675人)并承认因资金问题经营困难后,维珍轨道(Virgin Orbit)的控股公司现在申请破产。该公司提交的财务文件显示,其现有2.43亿美元资产、背负1.535亿美元债务。...
日期:04-04
三星galaxy s8_三星galaxy s8价格
三星Galaxy S8 是三星公司于2017年4月发布的一款智能手机产品。作为三星手机系列的旗舰产品,Galaxy S8 在外观设计、硬件配置、摄像头性能等方面都有着卓越的表现,备受市场关...
日期:05-31
ROG幻14经典白图赏:全能配置 成就便携办公神器(rog幻14笔记本配置清单)
  笔记本电脑兼具轻薄与高性能是广大用户一直所期待的需求。伴随着AMD新一代锐龙HS系列处理器的发布,ROG推出的ROG幻14在AMD 锐龙74800HS处理器 的强大核芯以及GeForce RT...
日期:07-14
Nreal徐驰:未来AR眼镜规模将超越手机 国产企业有望领跑苹果
文|张俊   元宇宙热潮之下,VR/AR企业正在走向新一轮风口。   不过,在接受媒体采访时,Nreal创始人兼CEO徐驰更愿意将之称为空间互联网。他认为,从互联网到移动互联网之后,下个...
日期:08-17
好消息!好视通云会议助力又一批知名高校线上开学开课(好视通云会议官方免费下载)
  当前新型冠状病毒疫情形势依然紧张,为了努力确保疫情防控和教育教学同时抓好。全国各大高校迅速行动、周密部署,延迟开学期间通过线上开学开课做到“延迟开学不停教不停...
日期:09-28
“1.8nm”工艺王者归来 Intel确认5款CPU:2025年上市
快科技6月25日消息,Intel最近动作频频,先是3天内宣布了600多亿美元的投资计划,又宣布了成立55年来最重大的转型,将内部的晶圆制造业务拆分独立运营,还开放对外代工,其中18A工艺节...
日期:06-25
分析师:若微软成功收购动视暴雪,将推动Xbox Game Pass订阅用户达到1亿
IT之家8月15日消息,游戏行业分析师MichaelPachter近期就微软Xbox、动视暴雪的未决交易发表了看法,据估计,这家Windows和Xbox制造商将花费690亿美元收购动视暴雪。虽然这笔钱多...
日期:08-16
百度进军移动互联网 推智能手机操作系统(百度手机互联怎么使用)
  9月2日,百度CEO李彦宏在百度世界大会上正式对外发布了新的百度首页,同时还宣布推出手机系统“百度·易”,显示出百度将业务进军移动互联网的决心。   此次百度对新首页...
日期:07-22