您的位置:首页 > 互联网

2行代码,三体一次读完!港中文贾佳亚团队联手MIT发布超长文本扩展技术,打破LLM遗忘魔咒

发布时间:2023-10-09 23:41:05  来源:互联网     背景:

声明:本文来自于微信公众号 新智元(ID:AI_era),作者:好困 桃子,授权转载发布。

【新智元导读】大模型上下文从此不再受限!港中文贾佳亚团队联手MIT发布了全新超长文本扩展技术LongLoRA,只需2行代码,让LLM看小说,读论文,轻松拿捏。

中途迷失、模型偷懒、上下文越长大模型越笨……

体验过LLM的人,多少都会对文本输入长度带来的限制有所感触:

想和大模型讨论一些稍长的内容,就需要拆分输入,而前面输入的要点,很快就会被大模型忘记。

实际上,这些都是典型的大语言模型对话缺陷。就像先天有注意力缺陷的儿童,难以专注看完一本新书。而缺陷的关键,在于模型缺乏长文本处理能力。

如今,这个局面已经被打破了!

就在近日,由贾佳亚团队联合MIT发布的新技术和新模型,悄然登上各大开源网站的热榜:

Hugging Face热榜第一、Papers With Code热度第一,Github全部Python项目热度第五、Github Stars一周内破千,Twitter上的相关技术帖子浏览量近18万......

论文地址:https://arxiv.org/abs/2309.12307

成为嘀嗒顺风车车主有什么要求

代码和Demo地址:https://github.com/dvlab-research/LongLoRA

GitHub Stars已达1.3k

Twitter上的相关技术帖子浏览量近18万

这项名为LongLoRA的技术实用但却简单得令人惊讶:

只需两行代码、一台8卡A100机器,便可将7B模型的文本长度拓展到100k tokens,70B模型的文本长度拓展到32k tokens。

同时,该研究团队还发布了首个拥有70B参数量的长文本对话大语言模型LongAlpaca。

全球首个70B长文本大语言模型发布

LongLoRA的提出,让全球大语言模型的对话缺陷第一次得到解决,自此,几十页的论文、几百页的报告、鸿篇巨制不再成为大模型盲区。

对此,有专业人士激动地表示,LongLoRA是大语言模型迷宫中的希望之灯!

它代表着业界对长文本大语言模型的重新思考和关注,有效扩展了大语言模型的上下文窗口,允许模型考虑和处理较长的文本序列,是大语言模型的革新性发明。

除了技术革新外,大语言模型处理长文本问题的一大难点还在于缺少公开的长文本对话数据。

为此,研究团队特意收集了9k条长文本问答语料对,包含针对名著、论文、深度报道甚至财务报表的各类问答。

光会回答长问题还不够,该团队又挑选了3k的短问答语料与9K的长问答语料混合训练,让长文本大模型同时具备短文本对话能力。这个完整的数据集被称为LongAlpaca-12k,目前已经开源。

在LongAlpaca-12k数据集基础上,研究团队对不同参数大小7B、13B、70B进行了训练和评测,开源模型包括LongAlpaca-7B、LongAlpaca-13B和LongAlpaca-70B。

看小说、改论文、指点经济堪称全能王

话不多说,盲选几个demo,一起看看应用了LongLoRA技术叠加12K问答语料的大模型LongAlpaca效果。

让系统新读一篇论文,并根据ICLR的审查指南,对其提出修改意见,从而提升该论文的接收率:

LongAlpaca的意见是:通过更精确地阐明新颖性,提供更严格和更有对比性的实验结果(包括具体的数据集和指标)、更广泛的应用和未来发展方向,重点呈现关键贡献和影响,论文被接受的机会将得到提高。

为什么把朋友圈设置三天可见

现在,让系统读两篇新的不同的论文,让LongAlpaca概括ICLR和CVPR两个会议之间的风格区别:

LongAlpaca总结认为,CVPR论文倾向更具结构性和实验性的风格,专注于实用性和技术性。而ICLR的论文风格更加灵活,侧重关键的理论分析和数学推导,而非标准格式。

可以看出,经过训练的LongAlpaca模型已经可以很轻松地接受新的长篇学术论文,在学术相关问题的回答上相当精准。

接下来,再看看LongAlpaca模型在颇高阅读和理解门槛的经济领域的解读表现。

根据国际货币基金组织从2012年到2023年的全球经济展望的概述合集,对经济形势进行逐年总结以及对未来经济趋势进行预测:

LongAlpaca告诉我们,2023年全球经济形势不明朗,跟2022年相比,增长预计放缓;未来几年,全球经济扩张速度偏温和并将低于预期,而地缘政治紧张、金融市场波动等大的挑战依然存在,需通过多边合作和结构性改革小心应对。

此外,LongAlpaca还可以读新的长篇小说,读完后对内容进行分析。

下面选取的对比模型是13B参数的LongAlpaca和Llama2,且看各自表现。

名著《西游记》中,为什么孙悟空在大闹天宫时很厉害,但取经路上却屡屡受挫?

LongAlpaca给出了5点原因,大概可总结为:孙悟空的不成熟、强大的对手、力量的限制、敌人的欺骗、最初缺少同伴等因素导致了他在旅途中的失败。但随着时间推移,他获得了智慧、经验和战友,使他最终战胜了最强大的敌人。

而Llama2并没有给出正确答案:虽然他确实大闹天宫,但说他代表着不败的力量并不一定准确。事实上,他最终在西游记中被强大的唐三藏打败。

这一次让系统新读一次《三体》,然后问第一部中,叶文洁为什么要联系外星人,而后期又为什么后悔?

LongAlpaca认为,叶文洁最初接触外星人是出于理想主义和复仇,但随着时间的推移,她对人类的看法发生了变化,意识到自己可能给全人类带来的危险,她的悔恨与日俱增。回答得十分清晰。

而Llama2的回答则是,通过与外星人的互动,她希望能更深入地了解宇宙的本质,以及自己在宇宙中的位置。叶文洁逐渐意识到,外星人和他们的技术并不能解决她的问题。回答笼统,之后开始对小说整体进行评论,答非所问。

从模型给出的答案可发现,一些模型如Llama2[2]可能在预训练过程中见过相关小说,但如果在提问时进行仅根据小说题目进行短文本提问的话,回答并不理想。

两个模型的回答对比,高下立见。LongAlpaca改学术论文、点评全球经济大势和读小说,都是一把好手,完胜Llama2。

两行代码和三个关键结论

Llama2可以说是AI社区内最强大的开源大模型之一,行业位置领先,LongAlpaca居然可以完胜。其背后的LongLoRA技术成功引起网友们的注意,到底是怎么做到的?

原来大语言模型对长文本处理过程中,计算量的主要开销集中在自注意力机制(self-attention),其开销随着文本长度成平方次地增加。

针对这个问题,研究团队提出LongLoRA技术,并用分组和偏移的方式来对全局自注意力机制进行模拟。

简单来说,就是将长文本对应的tokens拆分成不同的组,在每组内部做自注意力计算,而分组的方式在不同注意力头(attention head)上有所偏移。

这样的方式既可以大幅度节约计算量,又可以维持全局感受野的传递。

2019年手机厂商销量全球排行榜

而且,这个实现方法也非常简洁,仅两行代码即可完成!

除此之外,LongLoRA还探索了低秩训练的方式。

原有的低秩训练方式,如LoRA[5],无法在文本长度迁移上取得良好的效果。

而LongLoRA在低秩训练的基础上,引入嵌入层(Embedding layer和 Normalization layers)进行微调,从而达到可以和全参数微调(Full fine-tune)逼近的效果。

进行不同长度文本扩展和训练时,LongLoRA、LoRA和全参数微调不同技术的具体效果如何,可以参考三个维度表现:

  • 在Perplexity-困惑度上,原有LoRA方法的性能在不断恶化,而LongLoRA和全参数微调都能在各种文本长度下维持很好的效果;

  • 在显存消耗上,相比于全参数微调,LongLoRA和原有LoRA都有大幅度的节省。例如,对于8k长度的模型训练,相比于全参数微调,LongLoRA将显存消耗从46.3GB降低到25.6GB。

  • 在训练时间上,对于64k长度的模型训练,相比于常规LoRA,LongLoRA将训练时间从90~100小时左右降低到52.4小时,而全参数微调超过1000小时。

极简的训练方法、极少的计算资源和时间消耗,以及极佳的准确性,令LongLoRA大规模推广成为可能。

目前,相关技术与模型已全部开源,感兴趣的用户们可以自己部署感受。

值得一提的是,这是贾佳亚团队继8月9日发布的可以分割一切的多模态大模型LISA后的又一力作。

相距不过短短两个月,不得不说,这研究速度和能力跟LongLoRA一样惊人。


返回网站首页

本文评论
京东方oled屏幕出货量「分析师预计京东方去年供应iPhone 12%-15%OLED面板」
1月5日消息,据国外媒体报道,在智能手机普遍采用的OLED面板方面,国内厂商京东方已有很大的进展,在向多家厂商供货,他们也是苹果iPhone所需OLED面板的供应商。对于京东方,在苹果产品...
日期:01-05
把苹果股票卖了!巴菲特:两年前犯过错 很愚蠢「巴菲特买苹果股票时的估值」
快科技5月7日消息,日前,一年一度的巴菲特股东大会”正式举行,92岁的伯克希尔哈撒韦董事长兼首席执行官沃伦巴菲特和99岁的副董事长查理芒格,与3万名投资者分享了诸多内容,整个股...
日期:05-07
2023云原生编程挑战赛正式启动,挑战36万元现金大奖_云原生课程
随着越来越多的企业上云,开发者的核心关注点转变为如何更好地利用云的能力,将产品快速推向市场,从而实现业务成功。但是,如果算力的呈现形式仍然是服务器这样的资源形态,它的使用...
日期:07-04
如涵控股在哪里上市_阿里等8家企业股东退出如涵控股
  5月31日上午消息,企查查数据显示,5月29日,网红电商杭州如涵控股股份有限公司发生工商变更,阿里巴巴、君联资本、赛富投资、昆仑万维、远镜创投、启明创投、钟鼎资本均退出...
日期:06-17
香飘飘的营收:起起落落落落落落落落落落(香飘飘盈利)
图片来源:视觉中国小米手表amazfitAPP   记者 |李昱茹;编辑 |牙韩翔   曾经的国民奶茶香飘飘营收再一次下跌。   8月12日晚间发布2022上半年业绩报告,上半年香飘飘实现...
日期:08-17
痛失世界首富宝座后!马斯克狂卖特斯拉股票:又套现200多亿
受特斯拉周一股价大跌影响,马斯克失去了全球首富这一头衔,由奢侈品巨头路威酩轩集团(LVMH)董事长Bernard Arnault接棒。华为mate50最新更新而日前,美国证交所文件显示,12月15日,马...
日期:12-15
美国禁销白炽灯泡 25岁小伙囤了3500个 够用一辈子「禁售白炽灯骗局」
根据美国能源部的新规定,今年8月1日起,美国正式禁止销售白炽灯泡,转而推广节能灯泡。这项禁令的主要内容是要求零售商在市面上销售的灯泡要达到每瓦至少发光45流明以上,而白炽灯...
日期:09-12
m3u8是什么格式?如何把m3u8视频转换成mp4?「m3u8文件怎么转换成mp4」
近年来,随着视频格式的多样化,出现了各种新的视频格式。m3u8格式逐渐受到关注,但这种视频格式只支持在线观看。 下载视频并将m3u8视频转换为mp4格式,以便您可以在本地播放。 那...
日期:11-25
苹果推出全新的macOS Sonoma系统
财联社6月6日电,苹果公司正在展示下一代MacOS,名为Sonoma。该系统将包括著名城市和风景的动态壁纸。此外,iPhone和iPad上流行的小部件现在也可以添加到Mac桌面。宝马数字钥匙会...
日期:06-06
最新确认:小米13 Ultra用上了USB 3.X接口
昨天,小米、徕卡双方同时宣布,徕卡影像旗舰小米13 Ultra将于本月发布。虽然官方今天没有带来任何预热,但是爆料信息已经来了,确认了一项重磅信息。爆料博主数码闲聊站表示,小米13...
日期:04-08
中国空调网_国家信息中心市场信息处发布空调消费趋势
   买空调:九成认变频,八成选双模<?XML:NAMESPACE PREFIX = O /> (联合电讯社/山东)--近日,国家信息中心信息资源开发部在京举办“空调产业技术发展和消费趋势高峰论坛”。会...
日期:07-29
华为问界宣布调价:最高降3万元 老车主最高可获3.5万补偿
凤凰网科技讯 1月13日消息,AITO问界发布公告宣布旗下车型调价,除顶配外都有不同幅度的降价。问界M5 EV起售价为25.98万元,问界M7顶配价格不变,舒适版与豪华版分别28.98万元和30....
日期:01-13
深挖新华百货团购需求 多点Dmall不断创新营收增长点_新华百货活动
(原标题:深挖新华百货团购需求 多点Dmall不断创新营收增长点) 8月23日晚间,新华百货(600785.sh)发布2023年半年报,报告期内公司实...
日期:08-25
iPhone14值得等吗「iPhone14 Plus被指年度最不保值的手机,渠道优惠1000无人买」
中关村在线消息:10月9日,据相关爆料,iPhone14 Plus一经上市立刻破发 被指“年度最不保值手机”,虽然与iPhone14 Pro与iPhone14 Pro Max同为iPhone14系列,但很显然iPhone14 Plus并...
日期:10-12
还说4G成熟够用?中国网速全面秒美国 邬贺铨:总用户数激增 向5.5G发展
快科技6月5日消息,对于国内5G用户数来说,随着相应网络覆盖的加强,预计2024年将达到新的台阶。中国工程院院士邬贺铨表示,目前5G发展已经到了关键拐点,5G用户数占移动总用户已经超...
日期:06-05
权益透明 绝不捆绑销售!AITO问界全新“CARE”服务战略正式发布_问界m5最新消息
快科技9月21日消息,今日,AITO问界品牌正式发布了CARE”服务战略,该战略发布后,问界将正式进入智慧汽车服务3.0时代。据悉,此次发布的CARE”服务战略共分为四大板块,分别是Customer...
日期:09-23
让营销踩上风火轮的生成式AI,在这场AI创新大赛中又进化了
机器之心报道编辑:杜伟大模型和生成式 AI 如何深度赋能商业,让企业降本增效,这是新的 AI 技术浪潮下必须要考虑的重要课题。百度的 AI 商业化之路对于赋能千行百业而言意义重大...
日期:08-30
发热、信号bug频出 沈义人吐槽苹果iOS 16:稳定性最差一代_ios15发热情况
两周前,伴随着iPhone 14系列的上市,苹果也正式推送了iOS 16系统,这本来是一次大版本更新,带来了不少新功能,然而没等果粉享受各种新功能,最近吐槽iOS 16问题多的网友占了上风。就...
日期:09-30
「苹果客服明确告知 退换货不支持了 「iPhone」-12辐射超标?」_苹果退货政策 不能损坏
来源:中关村在线iphone14系列新功能请问空调面板灯一直亮着怎么关据彭博社报道,苹果公司最近向其售后客服和技术支持团队发出指示,不要主动提供与iPhone 12手机辐射超标的咨询...
日期:09-15
雷军会编程吗「被讨论到三十年后的现在!雷军分享大二编写的语言开发程序」
凤凰网科技讯 8月14日晚间消息,小米集团创始人、董事长雷军发表“成长”年度演讲,分享过去30多年,几次重要成长的经历和感悟,雷军分享了自己在大二时使用汇编语言开发的程序,该程...
日期:08-15