您的位置:首页 > 互联网

清华唐杰团队新作:一口气生成2万字,大模型开卷长输出_清华大学学姐唐

发布时间:2024-08-15 22:37:08  来源:互联网     背景:

声明:本文来自于微信公众号 量子位 | QbitAI,作者:梦晨,授权转载发布。

一口气生成2万字,大模型输出也卷起来了!

清华&智谱AI最新研究,成功让GLM-4、Llama-3.1输出长度都暴增。

相同问题下,输出结果直接从1800字增加到7800字,翻4倍。

清华 唐杰

要知道,目前大模型的生成长度普遍在2k以下。这对于内容创作、问题回答等都存在影响,可能导致模型回答问题不全面、创造性降低等。

该研究由智谱AI创始人、清华大学教授李涓子和唐杰共同领衔。

论文及代码都已放在GitHub上开源。

诺基亚手机新款上市诺基亚9.3

有网友已经抢先体验。LongWriter-llama3.1-8b可生成万字长文《罗马帝国衰落史》,在MacBook Pro2018(32GB)上就能运行。

双11淘宝88vip消费券

输出内容很准确,可以得A++。

9B模型搞定万字输出

本项研究主要包括3方面工作。

  • 分析文本生成长度限制因素

  • 提出AgentWrite

  • 扩展LLM输出窗口大小

首先,研究人员构建了一个测试工具LongWrite-Ruler。通过测试多个大模型,他们发现所有模型在生成超过2000字的文本时都遇到了困难。

进一步分析用户和大模型的交互日志,研究人员发现只有超过1%的用户请求明确提到要生成超过2000字的文本。

为此,他们改变了模型在监督式微调(SFT)阶段使用的数据集的最大输出长度。

结果发现,模型的最大输出长度与SFT数据集中的最大输出长度呈显著正相关。

所以得出结论,现有模型在输出长度上受限主要是因为SFT数据集中缺少长输出样本。

即使模型在预训练阶段见过更长的序列,但是SFT阶段缺乏长文本样本,还是会影响输出长度。

为了克服这个限制,研究人员提出了AgentWrite。

这是一个基于Agent的pipline。

它允许将超长文本生成任务分解为多个子任务,每个子任务处理其中的一段。

具体流程是AgentWrite先根据用户指令制定出一个详细的写作计划,计划包括每个段落的主要内容点和目标词数。根据计划,AgentWrite依次提示模型生成每个段落的内容。

在AgentWrite基础上,团队利用GPT-4o生成了6000个长输出SFT数据,输出长度在2k到32k词之间,构成了数据集LongWriter-6k。并将这些数据添加到训练过程中。

清华大学唐杰个人简介

为了验证方法的有效性,团队还提出了一个LongBench-Write。其中包含了多样化的用户写作指令,输出长度规格分别为0-500词、500-2000词、2000-4000词以及4000词以上。

评估结果显示,使用AgentWrite后模型输出长度明显增加。

苹果超萌头像

通过直接偏好优化(DPO),GLM-4-9B在一众模型中实现了最佳性能。

手速快的网友已经抢先实测。

Reddit上一位网友让LongWriter-llama3.1-8b生成罗马帝国衰败史,整体需要22分钟(与硬件有关),平均每秒生成3.34个token。

生成内容比较公式化,回答不同问题的结构、节奏相似。

无论如何这是个好的开始,带来的提升很明显。

研究团队也表示未来将进一步扩展模型的输出长度和输出质量,同时也会开始研究如何在不牺牲生成质量的情况下提高效率。

参考链接:

https://github.com/THUDM/LongWriter

—完—


返回网站首页

本文评论
上海黛琳化妆品有限公司「黛琳珠宝荣获钛媒体2023 EDGE AWARDS全球创新评选“年度新消费品牌”」
(原标题:黛琳珠宝荣获钛媒体2023 EDGE AWARDS全球创新评选“年度新消费品牌”) 12月1日-2日,2023 T-EDGE全球创新大会暨EDGE AW...
日期:12-04
苹果确认MacBook Air出现防反射涂层问题(macbook air屏幕有涂层吗)
  外媒爆料称,苹果确认部分MacBook,MacBook Air和MacBook Pro电脑上的视网膜显示屏可能会出现防反射(AR)涂层问题。   苹果于2018年10月在MacBook Air上添加了Retina显示...
日期:06-02
庆余年央视点名「央八收视率峰值破2!网友:《庆余年2》广告好多」
快科技5月16日消息,时隔五年,电视剧《庆余年2》终于在今晚开播,关于剧情的话题在热搜榜刷屏。《庆余年2》到底有多火爆?据CCTV电视剧”官微,数据显示,CCTV-8黄金强档热播剧《庆余...
日期:05-17
还记得那个要做你“人生搜索引擎”的App吗?它集成了GPT-4_人生必做的事情你完成了几个
品玩曾在今年初报道过一款叫做Rewind的产品。简单理解这款产品想做的事情就是,它想像《黑镜》第一季《你的全部历史》那集那样,只要在人体植入一块记忆芯片,就能完整地记录下人...
日期:08-07
有钱人骑电瓶车「有钱人为何在意电动车电费?李想用超级富豪朋友习惯解释原因」
快科技5月3日消息,相比传统的燃油车,电动车一个重要优点就是电费比油费便宜,但是这个解释对有钱人适用吗?很多网友认为有钱人就对那点电费、油费不在意了,而理想创始人给出了一...
日期:05-03
雷军公布小米澎湃 OS、汽车大压铸两项自主技术获百万美元最高技术大奖
1月4日 消息:1月4日,小米集团董事长兼CEO雷军发文宣布,2024年第一件大事就是颁发小米百万美元技术大奖。其中最高奖项的两项技术分别是“一体化大压铸技术”和“小米澎湃OS新...
日期:01-04
苹果将推iPhone 17 Slim机型:设计大改 后摄居中_iphone 17+
快科技5月18日消息,近期有多方爆料都提到,苹果会在明年发布一款全新的手机iPhone 17 Slim。lol2021春季赛lckSlim版本将取代原来的Plus机型,屏幕尺寸是6.55英寸,比标准版和Pro版...
日期:05-18
2024 年底前公布详情,印度塔塔集团要新建半导体工厂_印度塔塔集团股份构成
IT之家 1 月 11 日消息,塔塔集团董事长陈哲(Natarajan Chandrasekaran)近日公开表示,该集团计划 2024 年年底前,公开在古吉拉特邦建设最先进半导体制造厂的计划。在近日举办的古...
日期:01-11
移动5g用户数「通信业"成绩单":5G移动电话用户占比首超50%」
通信世界网消息(CWW)5月21日,工信部公布2024年1—4月份通信业经济运行情况。公告显示,1—4月份,我国通信行业整体运行平稳。电信业务量收平稳增长;5G、千兆光网等新型基础设施建设...
日期:05-22
京东李娅云简介「京东科技CEO李娅云:以供应链思维推进绿色经济发展是最高效方式」
12月13日消息,近日,京东科技CEO李娅云表示:推动绿色低碳可持续发展,要经历节能提效、绿色替代、重构新的产业生态三个阶段,这对供应链提出了新要求,只有推动供应链数字化、智能化,...
日期:12-13
Mobileye披露与国际汽车制造商巨头基于核心技术平台的最新合作
通信世界网消息(CWW)2024年1月 8日,Mobileye(纳斯达克股票代码:MBLY)今日宣布,已获得一家西方主要汽车制造商的一系列量产项目合作:多个国际品牌预计将基于Mobileye三大核心平台——...
日期:01-10
谷歌10月6日举行新品发布会:两款新手机和首款智能手表将亮相「华为发布会智能手表」
  讯 北京时间9月7日早间消息,谷歌周二宣布,该公司将在10月6日举办秋季硬件产品发布会。此前,三星已经发布了新款硬件产品,而苹果公司也将于美国当地时间周三发布新款iPhone 1...
日期:09-08
已接入GPT3.5turbo-未来旗下产品将围绕AIGC做升级和探索 映宇宙
 【】4月4日消息,据悉,映宇宙集团已经接入GPT3.5 turbo,GPT4正在接入审核中。同时,映宇宙集团也于近日公布了在AIGC方面的布局计划。相关负责人表示,未来映宇宙在AIGC领域的探索...
日期:10-04
在抖音发布污蔑公司_抖音遭遇黑公关攻击 四千余篇黑稿造谣“毁掉年轻人”
  近年来,以“网络水军”为代表的“黑公关”正在越来越多地干扰到网络环境和互联网用户的日常生活。公安部曾公布,2018年共成功侦破自媒体“网络水军”团伙犯罪案件28起,抓...
日期:05-27
爱奇艺股价下跌_中概股周三收盘多数下跌 爱奇艺跌超6% 腾讯ADR涨超3%
Adobe Certified Professional   北京时间18日凌晨,美股周三收跌。美联储7月会议纪要显示多位委员担心货币政策过度紧缩,未来某个时候会放缓加息步伐。美国国债收益率攀升。...
日期:08-19
微信输入法要来了!腾讯申请微信输入法商标_微信上的输入法
  讯 8月30日上午消息,天眼查App显示,近日,腾讯科技(深圳)有限公司申请注册多个“微信输入法”图形商标,国际分类涉及科学仪器、教育娱乐、通讯服务等,当前商标状态均为申请中。...
日期:09-10
​DrugAssist:基于LLM的分子优化模型 可以用自然语言与人类实时交互
**划重点:**封号、破产、裁员,亚马逊中国卖家的艰难60天- rog strix g15 笔记本客如云智能云餐厅长时间面对电子产品...
日期:02-04
华为智慧屏v55 2021款评测「华为智慧屏 V5 Pro 85/98 英寸新品参数曝光,22999 元起」
IT之家 9 月 23 日消息,华为日前宣布将于 9 月 25 日的秋季全场景新品发布会推出华为智慧屏 V5 Pro。现在,爆料博主“看山的叔叔”曝光了该系列电视新品的配置和价格信息。据...
日期:09-24
花呗车神卡送特斯拉车主1000度电:1月31日前可领充电红包_花呗金兑换特斯拉
快科技1月19日消息,昨日,特斯拉官方宣布,花呗车神卡送特斯拉车主1000度电。据悉,昨日,花呗车神卡与特斯拉发起联合活动,为特斯拉车主送上1000度电的充电福利,且该活动有效期在1月18...
日期:01-19
AMD下代三大GPU核心靓照公布:瘦成一道闪电(amd的GPU)
推特博主Wild_C近日又制作了一组AMD下一代三大GPU核心的渲染图,和之前的不太一样,毕竟信息更新了。Navi 31大核心采用一个GCD、六个MCD的小芯片组合,之前传闻面积分别是369、4...
日期:08-19