您的位置:首页 > 互联网

Colossal-AI团队开源了SwiftInfer 大模型无限流式输入推理飙升46%

发布时间:2024-01-08 17:59:15  来源:互联网     背景:

要点:

1. 国产开源项目SwiftInfer实现了无限流式输入推理,提升46%推理性能;

2. 围绕流式超多轮对话,文章详细解释了StreamingLLM的attention sink注意力机制,窗口注意力优化、KV Cache机制优化等方法的原理和优势;

盈康一生怎么样

3. 团队成功将StreamingLLM方法与TensorRT推理优化结合,带来46%的推理吞吐速度提升。

1月8日 消息:近日,国产开源项目SwiftInfer实现了无限流式输入推理,成功提升了大模型推理性能46%。这是一个重大突破,可以为多轮对话场景提供高效可靠的落地方案。

它采用了attention sink注意力机制、窗口注意力优化、KV Cache机制优化等方法,SwiftInfer的推理性能得到了极大提升,为大模型多轮对话推理提供低成本、低延迟、高吞吐的最佳实践。

项目地址:https://top.aibase.com/tool/swiftinfer

在这一方法中,使用了TensorRT的API,获得了接近于PyTorch API的模型编写体验。这对于进一步提升推理性能起到了重要作用。

SwiftInfer通过了解了注意力模块中Softmax的输出,发现了attention sink的现象,使得在多轮对话的情景下,生成效果更加稳定。

它使用了基于attention sink的注意力机制,无论是在计算复杂度还是生成效果上都表现优异。经过SwiftInfer的优化,推理性能提升非常明显。

Colossal-AI团队发布的SwiftInfer在推理性能上的提升很明显,为大模型多轮对话推理提供了高效可靠的落地方案。

Colossal-AI目前已获得GitHub星数三万五千多颗,位列全球TOP400,细分赛道排名世界第一,可通过高效多维并行、异构内存等,降低AI大模型训练/微调/推理的开发与应用成本,提升模型任务表现,降低GPU需求。


返回网站首页

本文评论
同比增长196.88%,网宿科技2023上半年实现净利润2.58亿元
【】8月23日消息,今日晚间,网宿科技发布了2023半年报。2023年上半年,网宿科技实现营业收入23.27亿元;实现归属于上市公司股东的净利润2.58亿元,同比增长196.88%;归属于上市公司股...
日期:09-16
谷歌宣布为 Chat 应用网页版和 PWA 版推出黑暗模式
  8 月 22 日消息 谷歌于 8 月 20 日宣布,自家的 Google Chat 聊天应用网页版、PWA 版将推出黑暗模式,开启后可以获得与移动 App 类似的体验,有助于减缓眼镜疲劳。   Goog...
日期:07-17
创意模型设计大赛「百度推首个大模型创业大赛:奖金高达千万元」
快科技5月31日消息,百度CEO李彦宏在摩根大通全球中国峰会上宣布,百度将设立10亿元的百度文心投资基金,同时启动文心杯”创业大赛,最高奖项为1000万元早期投资。苹果的电量图标李...
日期:06-01
北京讯鸟科技有限公司_讯鸟分布式移动客服——让我们宅在家里轻松办公吧!
  如果你感到浑身乏力和酸痛,不要过分紧张,这可能是长时间躺床上刷手机造成的!   宅在家里的乐趣,多半来自于随时可以外出~   前天睡醒,假期还剩三天;昨天睡醒,假期还剩五天;...
日期:02-09
麦当劳在抖音直播卖汉堡,一天卖出1000万_麦当劳在抖音直播卖汉堡,一天卖出1000万
声明:本文来自于微信公众号 电商头条(ID:ecxinwen),作者:李松月,授权转载发布。麦当劳在抖音直播,一天卖出1000万经过两年多的布局,本地生活早就成了抖音生态中不可或缺的一环。今...
日期:11-05
特斯拉宣布 4680 电池产量破 2000 万_特斯拉4680电池投产
IT之家 10 月 12 日消息,虽然产能和性能都跟不上宣传口径,但特斯拉依然坚定着在 4680 电池这条路上走下去。amd zen5架构特斯拉刚刚宣布,第 2000 万个 4680 电池已经在美国得克...
日期:10-12
数据要素地位「数据要素产业服务平台(DISP)发布,提供高质量数据解决方案」
通信世界网消息(CWW)随着我国数据要素基础制度逐渐建立,政策逐渐走深走实,数据要素相关产业即将步入纵深发展。在此关键时期,数据要素产业仍存在“相关信息的渠道多源”“数据零...
日期:09-27
向武汉大学捐赠13亿!雷军:无论捐多少都是对母校的爱_雷军捐了多少给武汉大学
快科技12月1日消息,据武汉大学官网消息,小米创办人雷军近日向母校武汉大学捐赠13亿元人民币。 今日,雷军发文表示,每个人都对母校有着刻骨铭心的爱,我非常感恩武汉大学对我培...
日期:12-01
麻烦来了!两位作家起诉OpenAI 称ChatGPT侵犯版权
①ChatGPT未经同意,直接复制了书籍的数据来进行训练,这侵犯了作者的版权;②这起诉讼将探讨生成式人工智能领域“合法性边界”的问题。癌症是怎么来的怎么预防财联社7月6日讯(编...
日期:07-06
阿里健康互联网医院上线70岁以上老人新冠治疗药专属通道_阿里健康互联网医疗事业部
1月14日消息,近日在社交平台上有多位网友分享,在阿里健康互联网医院可以开出新冠口服药了。小米最高价有网友在“淘宝”app搜索“新冠问诊”时发现,阿里健康互联网医院新冠发热...
日期:01-14
网友调侃不相信马斯克买下推特 马斯克回应「马斯克最近推特」
凤凰网科技讯 北京时间2月3日消息,早些时候有网友发推文表示,自己还是不敢相信马斯克买下推特。马斯克回帖表示“我也不信”。竞猜淘金团图源:推特截图随后,马斯克继续回帖称“...
日期:02-03
科大讯飞:讯飞医疗全面升级医疗诊后康复管理平台_科大讯飞医疗ai平台
7月13日 消息:科大讯飞在互动平台表示,基于星火认知大模型,讯飞医疗全面升级医疗诊后康复管理平台,将专业的诊后管理和康复指导延伸到院外。根据患者健康画像自动分析,平台可为...
日期:07-13
高合汽车再放大招!HiPhi OS新版本上线:增加21项新功能
快科技10月10日消息,日前,高合汽车HiPhi OS 3.3.0 Z正式上线,此次更新覆盖智能驾驶辅助、地图导航、娱乐应用、车辆设置等多个版块。此外,全新的HiPhi OS 3.3.0 Z还新增了21项功...
日期:10-11
三星正开发自有AI大语言模型 已投入全部GPU资源_三星ai功能
据韩媒“Chosun Ilbo”报道,三星电子已于本月初正式开启了大语言模型(LLM)的开发工作。该项目由三星研究院主导,动员了所有相关的人力和资源,以7月末完成初期开发为目标,该项目将...
日期:06-10
我国10亿参数规模以上大模型已发布近80个
人工智能技术的突飞猛进发展,为我们的生活带来巨大改变和机遇。据中国信息通信研究院测算,2022年中国人工智能核心产业规模达5080亿元人民币。目前,10亿参数规模以上的大模型已...
日期:11-10
当年谷歌怎么败给百度的「Google比百度多付4000万美金也没做出ChatGPT-李彦宏」
【】5月5日消息,百度创始人、董事长兼首席执行官李彦宏4日在内部“新使命六周年暨百度骄傲颁奖典礼”上发表讲话,回顾了百度一直以来的人工智能战略,提出未来要有意识地培养AI...
日期:09-30
oppo智能手机报价「oppo智能手机报价大全」
OPPO智能手机是一款兼备高性能和外观设计的智能手机,其不仅在设计和外观方面卓越,同时在性能和功能上也有着出色的表现。下面我们就来看看OPPO智能手机的报价情况。元宇宙元素...
日期:05-29
英特尔旗下Mobileye正开展下一代驾驶辅助系统测试_英特尔自动驾驶mobileye
品玩8月16日讯,英特尔官微发布消息称,旗下自动驾驶公司Mobileye正在进行对下一代驾驶辅助系统Mobileye SuperVision™的测试,在技术仅绘制过地图但测试车辆从未行驶过的道路上,...
日期:08-18
共享充电宝使用一次多少钱「充一次最高花40元 共享充电宝怎么成了“价格刺客”?」
近日,共享充电宝涨价的话题冲上热搜。北京青年报记者看到,目前多数充电宝价格在每小时3-4元,最高的达一小时10元。消费者表示,租借前并不能看到价格,希望厂商可以增加价格透明度...
日期:09-15
“1688买家旺旺”延迟至2月8日下线_1688发货超时
2月3日 消息:今日,1688平台发布公告称,“1688买家旺旺”(以下简称“买家旺旺”)原定于2023年2月1日正式下线(。为保障您的服务体验,现推迟至2023年2月8日正式下线,下线后平台将根...
日期:02-03