您的位置:首页 > 互联网

ailp模型「StreamingLLM:让AI模型无限期平稳运行的一种方法」

发布时间:2023-10-08 11:43:19  来源:互联网     背景:

要点:

三星lg合作计划

1. Meta、麻省理工学院 (MIT) 和卡内基梅隆大学 (CMU) 的研究人员介绍了一项名为StreamingLLM的技术,旨在解决大型语言模型(LLMs)在长时间对话中性能下降的问题。

2. StreamingLLM利用“attention sinks”(关注点汇)的概念,通过在对话的不同阶段重新引入初始标记,使LLMs能够在无限长度的文本上保持高性能。

3. 研究人员还提出了使用单个特殊标记作为“attention sink”来稳定LLMs的关注机制,从而在长时间对话中保持高性能。

10月8日 消息:Meta、麻省理工学院 (MIT) 和卡内基梅隆大学 (CMU) 的研究人员最近发表的一篇新论文介绍了一项名为StreamingLLM的创新技术,旨在解决大型语言模型(LLMs)在长时间对话中性能下降的问题。

LLMs如OpenAI的ChatGPT和Meta的Llama2在当今的人工智能领域备受关注,但它们都面临一个共同的挑战,即在与用户的对话中始终提供高质量的响应,无论对话持续多长时间或交换的对话数量如何。这是因为LLMs在训练时是基于特定长度的数据块或序列进行预训练的,一旦用户输入的标记超过了这个长度,LLM的性能就会下降,这对企业希望在开放式对话中使用LLMs来帮助客户或员工是不可接受的。

ai模型训练

图源备注:图片由AI生成,图片授权服务商Midjourney

StreamingLLM的解决方案是利用“attention sinks”概念,这些是在对话的不同阶段重新引入初始标记,以使LLMs能够在无限长度的文本上保持高性能。

aidms模型

研究人员发现,LLMs在对话或训练的早期会更加关注初始标记,因为它们对所有后续标记可见,而后续标记只对有限的后续标记可见。因此,通过在对话后期重新引入一些初始标记,用户可以有效地恢复LLM的性能。这就好比通过在对话后期使用与开始对话时相同的关键词,突然使LLMs在对话后期能够提供高质量的响应。

研究人员还提出了使用单个特殊标记作为“attention sink”的方法,通过在对话的不同阶段手动或自动重新引入此标记,可以持续保持LLMs的性能。这项技术使LLMs能够在无需频繁刷新缓存的情况下,不间断地为用户提供帮助。然而,研究人员也强调了这项技术的局限性,它并不扩展LLMs的上下文窗口,也不能确保LLM会记住对话的每个时刻的内容。

综合而言,StreamingLLM技术为LLMs在长时间对话中保持高性能提供了创新的解决方案,有望在许多领域,特别是需要持续不断地与用户交互的应用中得到广泛应用。


返回网站首页

本文评论
美股周三:纳指跌超1.5%,主要中概股普跌,小鹏跌逾10%_美股集体收高!纳指涨超2%
美国时间周三,美股收盘主要股指全线下跌,科技股领跌。美国10月份零售销售强劲,再次引发人们对美联储加息步伐的担忧。道琼斯指数收于33553.83点,下跌39.09点,跌幅0.12%;标准普尔50...
日期:12-02
日入斗金,稳赚不赔?小心泛滥网络的兼职刷单让你钱尽财空
  “足不出户,日赚千元”、“动动手指就能轻松赚钱”......此类兼职刷单广告,常常霸占着网页的每一个角落,绞尽脑汁的想要拉人入坑。对于网民来说,相比每天死盯着股市大盘,时...
日期:07-14
Facebook创始人探访百度或为探路内地市场_facebook 调研
  昨日(12月20日),Facebook创始人马克·扎克伯格(MarkZuckerberg)及其女友被曝现身百度公司,并与百度CEO李彦宏在 百度员工食堂共进午餐。百度公司人士确认了此事,称扎克伯格系...
日期:07-25
重装Win7不怕丢数据金山装机精灵1分钟闪电备份
  无论Windows7多完美,总会有系统崩溃的那一刻。然而重装Windows7是一件艰难重重的事情,首先要做的并不是找各种各样的Windows7重装盘,而是先把个人的重要数据一个一个找出...
日期:07-22
特斯拉Q4交付量首破40万创纪录 但全年仍未达增长目标「特斯拉Q4」
凤凰网科技讯 北京时间1月3日消息,特斯拉公司周一公布了2022年第四季度及全年汽车交付量数据,该公司第四季度交付量首次站上了40万辆,但是全年交付量未能达到50%的增长目标。na...
日期:01-03
传苹果已最终确定iPad 3供应商 10月投产
8月26日消息,据国外媒体报道,苹果据说已经最终确定了iPad 3平板电脑的供应商名单,保留了iPad 2供应链中的许多关键的合作伙伴并且将在10月份开始生产其下一代平板电脑iPad 3。...
日期:07-22
ibm收购oracle「IBM宣布将46亿美元收购软件公司Apptio 提升AI能力」
6月27日 消息:日前,IBM表示,将以46亿美元收购 FinOps 软件提供商 Apptio,以进一步增强其混合云和人工智能能力。Apptio 的 SaaS 产品使技术部门能够管理混合和多云环境、劳动力...
日期:06-27
华为盘古大模型3.0正式发布_盘古大模型是干什么的
通信世界网消息(CWW)大模型开始“卷”起来了。去年年底,ChatGPT往喧嚣已久却未有波澜的AI“湖面”投掷了一枚“石头”,仅用2个月时间就收获了1亿用户。当学生用其写论文、程序员...
日期:07-08
张朝阳对话彭凯平:人活着就要搞事情
  处在低谷的时候,我们依然要认为,人生是有意义的。  文|《中国企业家》记者 赵东山  编辑|李薇  头图来源|中企图库  你是否也曾经历过一些低落、抑郁、焦虑不安的...
日期:12-15
Meta Quest 3固件泄“天机”:新头显支持室内物体自动识别
快科技8月31日消息,早些时候,Meta宣布,将在9月27日正式发布新一代VR头显Meta Quest3。现在,这款头显的系统固件泄露,展现出了它的部分新功能。xr云平台根据目前泄露的信息,Quest3...
日期:08-31
美国这环境?男子从苹果店购买300部iPhone 13 出门就遭抢劫_美国苹果店被洗劫
美国这环境感受下,一男子从苹果第五大道零售店买完iPhone,出门就被抢劫?小米十周年 雷军公开演讲黑莓全键盘手机的经典有哪几个据纽约1010Wins电台报道,一名不愿透露姓名的27岁...
日期:12-02
入手三星S10只需3661元?苏宁门店最火爆新品卖疯了(三星s10便宜)
  3月16日,在苏宁易购全民焕新节的最后爆发期,苏宁手机官微发布三星S10系列新品以旧换新补贴政策,用户持旧机在苏宁以旧换新购买三星S10,最高可获得额外补贴1188元,活动时间3...
日期:11-19
周杰伦还开演唱会嘛「刘德华、周杰伦以后开线上演唱会可能没那么容易了」
  持续火爆、且规模可观的在线演出市场,将面临新的监管和合规要求。  文|张剑;编辑|郭丽琴  来源:财经E法;  今年以来,周杰伦、梁静茹、李健、刘德华等明星都举办了现象...
日期:10-02
《美猴王》发布剧照被吐槽丑 Netflix联合周星驰制作
《西游记》是我国四大名著之一,是陪伴每个人成长的经典之作。不仅有文字版本,各种影视作品也层出不穷。荣耀80 pro三体限定版早前,Netflix宣布与周星驰联合制作动画电影《美猴...
日期:04-28
打造示范区!伏泰纳故“四步走”推动潜江泰丰垃圾分类落地见成效
  根据《省人民政府办公厅关于印发湖北省推进城乡生活垃圾分类工作实施方案的通知》要求,2021年潜江市泰丰街道办事处建成生活垃圾分类标准化片区。   2020年11月,通过委...
日期:09-16
法拉第未来卖掉总部「法拉第未来:将向贾跃亭交付车辆」
10月7日 消息:昨日晚间,FF(FaradayFuture)宣布,向FF创始人兼首席产品和用户生态官贾跃亭交付FF912.0Futurist Alliance。据悉,贾跃亭的交付共创活动将分为三个阶段。性价比高的投...
日期:10-07
华为进入美国「国家安全部:美国2009年开始入侵华为总部服务器」
安平/“国家安全部”微信公号“国家安全部”微信公众号20日发布文章《起底美国情报机关网攻窃密的主要卑劣手段》,其中指出:近日,中国国家计算机病毒应急处理中心通报,在处置西...
日期:09-21
遥望直播旗下艺人「遥望科技正式成立淘宝直播事业部」
3月24日消息,遥望科技继去年双11入淘开播后,日前正式成立淘宝直播事业部。这也是继罗永浩所属的MCN交个朋友,组建专属的淘宝事业部之后,又一抖音MCN加码淘宝直播。广汽本田(缤智...
日期:03-24
橙色预警!寒潮天气继续影响中国一「今冬以来!此次寒潮局地气温暴跌20℃:将发橙色预警 要冻哭了」
11月27日上午10时,中央气象台继续发布寒潮黄色预警,官方更是将其称为今冬以来最强寒潮。中央气象台将于今天下午升级发布寒潮最高等级的橙色预警。李彦宏对互联网的贡献预报称...
日期:12-04
新钉钉拍照可以生成小程序_钉钉 拍照
  讯; 4月18日上午消息,钉钉展示了内测的AI进展,在钉钉输入斜杠“/”即可唤起智能服务。过去开发小程序需要写代码,现在只要画个表拍张照,就能生成一个表单小程序。除此以外,钉...
日期:04-18