您的位置:首页 > 互联网

英特尔推Extension for Transformers工具包 大模型推理性能提升40倍

发布时间:2023-11-30 20:58:48  来源:互联网     背景:

要点:

  • 通过该工具包,使用英特尔® 至强® 处理器可实现大型语言模型(LLM)推理性能加速达40倍,满足各种应用需求。

  • 工具包提供轻量级但高效的LLM推理运行时,优化了内核,支持多种量化选择,提供更优的KV缓存访问和内存分配策略,显著提升了性能。

  • 工具包攻克了对话历史、输出长度有限以及效率低下等聊天场景应用难题,通过引入流式LLM技术优化内存使用和推理时延。

11月30日 消息:在当前技术发展的背景下,英特尔公司推出的Extension for Transformers工具包成为一个重要创新,实现了在CPU上对大型语言模型(LLM)推理性能的显著加速。该工具包通过LLM Runtime技术,优化了内核,支持多种量化选择,提供更优的KV缓存访问和内存分配策略,使得首个token和下一个token的推理速度分别提升多达40倍和2.68倍。这一技术的推出,极大地满足了不同场景对于LLM推理性能的需求。

荣耀note10打不开turbo

项目地址:https://github.com/intel/intel-extension-for-transformers

在性能测试方面,通过与llama.cpp进行比较,LLM Runtime在输入大小为1024时能够实现3.58到21.5倍的性能提升,而在输入大小为32时,提升为1.76到3.43倍。同时,工具包还通过验证了多个模型的INT4推理准确性,表明在性能提升的同时准确性损失微小。

然而,不仅仅是性能的提升,工具包还在聊天场景中应用方面取得了显著成果。通过引入流式LLM技术,解决了对话历史、输出长度有限和效率低下等应用难题,使得LLM在聊天场景中更加实用。这一技术的特性,包括对话历史的纳入和输出长度的优化,使得工具包在解决聊天场景难题方面具有先进性和前瞻性。

英特尔® Extension for Transformers工具包在大型语言模型推理性能的提升以及聊天场景应用方面的创新成果,标志着对于人工智能领域的进一步推动。通过不断引入先进的技术和解决实际问题的能力,该工具包展现了英特尔在人工智能领域的领先地位,为未来的发展提供了强有力的支持。


返回网站首页

本文评论
荣耀上市后市值对标小米还是谁?赵明:都不是对标目标_荣耀销量超越小米
【手机中国新闻】11月23日晚,荣耀举行新品发布会,正式推出了全新荣耀100系列。晚些时候,手机中国注意到,发布会结束会,荣耀举行了媒体提问环节,有媒体问了赵明关于荣耀上市的问题,...
日期:11-24
智界S7续航超800公里 余承东:可以做家庭第一辆车
快科技11月9日消息,今晚华为智选车首款高能大空间智慧轿车智界S7预发布。 余承东介绍称,智界S7引领汽车进入双800”时代:800V超级快充、800 km。 据了解,智界S7搭载全新华为...
日期:11-10
谷歌市值破万亿美元_Twitter拒绝了谷歌的100亿美元收购报价
  导读:坊间有传言称Twitter拒绝了谷歌的100亿美元收购报价,MarketWatch专栏作家德沃拉克(John C. Dvorak)分析指出,虽然Twitter目前炙手可热,但是既无营收模式也无核心技术,而...
日期:07-27
爱国者胜诉东芝专利侵权案 将立足存储主业
  近日,爱国者在诉东芝USBPLUS高速数据接口专利侵权案中胜诉,并获得20万人民币的理赔费用,同时本案涉及侵权的2款东芝笔记本电脑将不被允许在中国大陆进行销售。据了解,爱国...
日期:07-24
英特尔发4款超低电压移动处理器和销售价格_英特尔移动处理器规格表
【赛迪网讯】6月21日消息,据国外媒体报道,英特尔周日发布了赛扬847、酷睿i5-2557M、酷睿i7-2637M和i7-2677M四款超低电压处理器的官方价格。重要的是指出这个价格表是不全面...
日期:07-30
搭载骁龙8+处理器」-迄今为止最强悍小米平板 「小米平板6即将到来
这段时间以来,各大品牌今年的首款代表性旗舰陆续亮相,还未发布的机型中最受关注的自然要数全新的小米13 Ultra了,据多方爆料显示,该机将于本月与大家见面。而本次发布会上除了这...
日期:09-18
宽带用户全部负增长,这到底怎么回事?_电信宽带余额负数
  和大家预期中的年末翘尾不同,固网宽带用户增长出现了滑铁卢,其中包括一直以来凯歌猛进的中国移动。宽带用户出现的这波负增长,到底是怎么回事?下面这些影响因素值得大家思...
日期:02-10
专家称洗头可洗掉沾染的放射性元素:碘-129并非无药可救
日本福岛核污水排海,所带来的影响虽然暂时缺乏定论,但必然是广泛、深入、长远的。我们必须得学习一些相关知识了。核污水虽然只是排入大海,但也会通过蒸发、降雨等各种形式传入...
日期:08-27
钠电池比锂电池「比锂资源便宜75倍 钠离子电池成本更低:储量丰富 不依赖进口」
随着电动车的发展,锂电池已经成为动力电池的主要选择,目前国内公司在锂电池市场上占据优势,宁德时代、比亚迪等公司都是世界前列的锂电池供应商,然而锂电池的槽点也不少,成本贵、...
日期:02-05
马斯克推特怎么看「马斯克称推特将不再显示设备型号  称这完全没必要」
11月15日 消息:马斯克接手推特后,局面一片混乱,出现了裁员、涨价、验证失败等情况。接下来这件事虽然很小,但对许多用户和媒体来说可能是一个时代的终结。当地时间11月14日,马斯...
日期:11-17
新iPad mini 7曝光:处理器升级 屏幕仍是LCD_ipad mini屏幕是几寸的
据苹果公司最新传闻,苹果有望在今年内推出iPad mini 7,但据X平台科技博主Tech_Reve的消息,iPad mini 7的升级仅为常规处理器的升级,仍无法拥有120Hz Pro-Motion高刷新屏幕。...
日期:10-11
贾跃亭被恢复执行超11亿 涉及与西部证券合同纠纷「贾跃亭股份出售」
小米蓝牙耳机2022最新产品苹果14pro和14pro max买哪个好苹果全球降价骁龙处理器61501月13日消息,天眼查App显示,近日,贾跃亭新增一则恢复被执行人信息,执行标的11亿余元,执行法院...
日期:01-13
大熊猫被小鸟薅毛毫无反应淡定干饭 网友:不愧是竹林隐士「堪称鸟中大熊猫的鸟是什么鸟」
最近,陕西秦岭大熊猫研究中心的工作人员拍摄到一段有趣的画面,大熊猫被喜鹊“薅”毛。为什么喜鹊会对大熊猫身上的毛感兴趣呢?一起来看看。在视频中,11岁的秦岭大熊猫正正正躺...
日期:03-24
两对情侣因争位置在迪士尼大打出手 后续双方已和解「迪士尼打架视频7.23」
5 月 23 日,上海迪士尼乐园里两对恋人因为争夺观赏花车巡游的好位置而发生激烈争执,最后动起了手。 24 日,当地有关部门向极目新闻记者透露,双方已经和解了。网上流传的视频显示...
日期:05-25
香港房价暴跌回7年前 购房成本大大降低_香港房价最大跌幅超21%,造成房价下跌的因素有哪些?
近日,香港房价的急剧下跌,回到了7年前的水平。过去香港一直以来被认为是全球房价最贵的城市之一,但最近的数据显示出房价下跌趋势,也出现了泡沫的挤压。这种下跌不仅影响了购房...
日期:11-03
三星bixby「三星Big Screen TV Pop-up北京站启幕,开启家居陪伴的全面升维」
7 月 15 日,三星Big Screen TV Pop-up北京站在朝阳合生汇启幕。三星电视通过5D体验、光影艺术、空间变换等多种展现形式诠释科技和艺术的完美结合,为消费者提供了难忘的沉浸式...
日期:07-17
大巴上乘客脱鞋 女子巧用配音提醒:网友神总结_大巴司机甩客
外出乘车,难免遇到各种意外,霸座、争吵、熊孩子熊家长你会怎么处理呢?如果直接交涉,毕竟人的素质参差不齐,往往容易引发冲突,得不偿失。看看这位机智的姑娘!近日,在贵州黔南,一女子乘...
日期:08-12
一线品牌再卷,二三线也才刚刚私域“0.1”
声明:本文来自于微信公众号见实(ID:jianshishijie),作者:提效营专家课,授权转载发布。一线品牌私域再卷,二三线市场也才从私域“0.1”开始而已。这句话是见实与前西贝会员运营负...
日期:10-08
黑网吧日发12多万条“QQ中奖”信息被端(举报黑网吧有奖吗)
  广西贵港一“黑网吧”雇10名男子每日群发12多万条的“QQ 中奖”信息实施诈骗,被警方突袭查处。   贵港市警方13日介绍,近日,贵港市公安局城东派出所民警获知,在贵港市港...
日期:07-23
清华系ChatGLM3现场怼脸演示!多模态直逼GPT-4V,国产Code Interpreter来了_清华 mcfo
声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。【新智元导读】狂卷4个月,智谱AI开源第三代ChatGLM3!作为国内首个全线对标OpenAI产品线的公司,这波秀肌...
日期:11-13