您的位置:首页 > 互联网

清华大学提出全新加速训练大模型方法SoT

发布时间:2023-11-24 11:53:18  来源:互联网     背景:

要点:

  • 研究人员提出了一种名为“Skeleton-of-Thought(SoT)”的创新方法,旨在加速大型语言模型(LLMs)的生成速度,以解决其处理速度较慢的问题。

  • 与传统方法不同,SoT不对LLMs进行复杂的修改,而是将其视为黑匣子,专注于优化输出内容的组织,通过引入独特的两阶段过程来提高响应速度。

  • 通过对12个不同领域的模型进行测试,使用Vicuna-80数据集,研究团队观察到SoT在八个模型上实现了1.13x到2.39x的速度提升,而不牺牲答案质量。

11月24日 消息:近日,微软研究和清华大学的研究人员共同提出了一种名为“Skeleton-of-Thought(SoT)”的全新人工智能方法,旨在解决大型语言模型(LLMs)生成速度较慢的问题。

电子商务毕业答辩ppt范文

电子印章哪个政府部门

尽管像GPT-4和LLaMA等LLMs在技术领域产生了深远影响,但其处理速度的不足一直是一个制约因素,特别是在对延迟敏感的应用中,如聊天机器人、协同驾驶和工业控制器。SoT方法与传统的性能提升方法不同,它不对LLMs进行复杂的修改,而是将其视为黑匣子,并侧重于优化输出内容的组织结构。

项目地址:https://github.com/imagination-research/sot/

SoT引入了一个独特的两阶段过程,首先引导LLM构建答案的骨架,然后在第二阶段使LLM同时扩展骨架中的多个要点。这一方法不仅提高了LLMs的响应速度,还在不需要对模型架构进行复杂调整的情况下实现了这一目标。

为了评估SoT的有效性,研究团队对12个不同领域的模型进行了广泛测试,使用了Vicuna-80数据集,其中包含了来自编码、数学、写作和角色扮演等各个领域的问题。

通过使用FastChat和LLMZoo的度量标准,研究团队观察到SoT在八个模型上实现了1.13x到2.39x的速度提升,而且这些提升并没有牺牲答案质量。这表明SoT不仅可以显著提高响应速度,还能够在各种问题类别中保持或提升答案质量。

英伟达rtx 4080显卡发布

因此,SoT方法为解决LLMs速度较慢的问题提供了一种有前景的解决方案。研究团队的创新方法将LLMs视为黑匣子,并专注于数据级别的效率优化,为加速内容生成提供了新的视角。通过引导LLMs构建答案的骨架,然后进行并行扩展,SoT有效地提高了响应速度,为人工智能领域的动态思维过程开辟了新的探索方向,鼓励向更高效、更多才多艺的语言模型发展。

红米k60最新消息


返回网站首页

本文评论
Intel 13代新爆品i5-13400现身:二选一玩“抽奖”
K/KF系列之后,Intel 13代酷睿还有大量的标准版、低功耗版型号等待发布,具体名字、部分规格早已被泄露。现在,我们第一次看到了i5-13400 CPU-Z截图和跑分,确认有6个大核、4个小核...
日期:11-07
抗疫期有头疼脑热怎么办?百度App有专业医生免费解答
  截至1月27日24时,国家卫生健康委收到30个省(区、市)累计报告确诊病例4515例,疫情现已进入了关键时刻,而在防控疫情方面,仍旧有诸多难题需要解决。其中,医疗资源的供应,是重中...
日期:06-04
拍10部火1部,道观也来凑热闹,短剧成吸金神器?
图片来源@视觉中国文 | Tech星球,作者 | 翟元元短剧《逃出大英博物馆》火爆出圈,《无双》小程序短剧上线8天消耗过亿元,短剧赛道总能以出其不意的爆款引人关注。短剧赛道发展迅...
日期:09-25
香港向内地旅客送出83000张机票 可选内地14城市出发「香港机票查询」
4月17日开始,国泰航空、香港航空针对内地旅客推出内地往返香港机票的优惠活动,分别为免费抽奖赢取83000张机票以及机票“买一送一”。电视机hdr和4k哪个更好国泰航空宣布,符合...
日期:04-18
快手调整【消费者保障】规则 将于10月18日生效「快手消费者保障服务在哪里设置」
10月11日 消息:今天,快手发布关于【消费者极致保障】规则的调整公告。公告称,为提升商户/带货达人服务水平和经营质量,给消费者创造更好的购物体验,现对《快手小店售后服务管理...
日期:10-28
iPhone 14 Pro翻车了!多人反馈满电无法开机:无故黑屏_iphone12promax频繁死机重启
iPhone 14系列已经上市一个多月了,目前热度已经从当时Pro的全网好评逐渐下降,而首批机型的一些问题也开始浮现出来。据微博黑猫投诉报道,一位在9月底购买iPhone 14 Pro系列的首...
日期:11-04
谷歌推出新的Web编程语言Dart(Google的编程语言)
  10月11日消息,据国外媒体报道,经过几个月的测试之后,谷歌终于推出了制作web应用程序的新的编程语言Dart。谷歌开发这个新的平台时主要考虑了简单性、效率和伸缩性,把强大的...
日期:07-23
中美审计监管合作破冰 中概股迎转机「证监会 中美审计」
  备受关注的中概股审计监管问题迈出重要一步。近期,证监会官网显示,证监会、财政部与美国监管机构签署审计监管合作协议,将于近期启动相关合作。对于此次合作的主要内容、意...
日期:08-29
活力四射,科西VE飓风筒吹风机,尽显花young潮型「科美思吹风机」
(原标题:活力四射,科西VE飓风筒吹风机,尽显花young潮型) 科西2022年推出的HC1高速吹风机,凭借高配置的转速和亿级负离子护发科技,...
日期:08-11
抢半价,抽全球游!奥田集成灶618全国联动火力全开,势在必行!_奥田集成灶的使用说明
一年一度的 618 狂欢盛宴已经拉开序幕,奥田早已进入紧锣密鼓的备战状态。为更好地落实产品力、服务力,奥田 618 全国启动会在各大区域火热开启,吹响了决胜的冲锋号角。苹果有bu...
日期:05-27
清凉一夏:高级SSL证书直降1000+元 网站必备https
夏日炎炎,烈日高照,这个季节最需要的就是清凉!而安信证书夏季大放价活动,正是为了让您以清凉的价格,使您的网站可以获得更加专业的SSL保护,更加轻松地应对网络攻击和数据泄露。夏...
日期:06-30
2023年淘宝天猫京东双11红包领取第2波京东天猫双十一活动时间什么时候开始到几号结束?
本文为大家提供众多福利:2023 年淘宝/天猫双十一红包第 2 波活动时间与领取入口最高 23888 超级红包及跨店满减规则;2023 年京东双十一红包第 2 波活动时间与领取入口最高 111...
日期:11-03
谷歌检索方式「谷歌搜索引擎上线“Notes”实验功能,允许用户在网页结果写笔记」
IT之家 11 月 17 日消息,谷歌日前在 Google Search Labs 中新增了一项名为 Notes 的实验功能,允许用户直接在网页搜索结果中书写笔记,也可以查看其它用户所写的笔记,分享彼此对...
日期:11-18
中国电动车太抢眼!官方:已成为不少国家新能源销冠_中国电动车现状
10月29日消息,据央视”报道,在日前国务院新闻办公室举办的2023年前三季度工业和信息化发展情况新闻发布会上,新能源汽车的表现十分抢眼。前三季度新能源汽车产销分别完成631.3...
日期:10-29
工信部 智能网联汽车准入「工信部将适时开展智能网联汽车准入试点」
IT之家 9 月 4 日消息,据央视新闻,工业和信息化部装备工业一司副司长郭守刚在中国汽车产业发展国际论坛上表示,下一步我国将发布汽车产业绿色低碳发展路线图;加快制定《道路机动...
日期:09-19
AI哨所|工资翻番、送宝马 印度开始疯抢AI人才
凤凰网科技讯 《AI哨所》 北京时间5月4日消息,生成式人工智能(AI)热潮正在引发一场人才争夺战。在印度,顶尖AI人才的工资会增加一倍,签字费是一辆宝马摩托车。在ChatGPT风靡全球...
日期:05-04
一图看懂联想拯救者Y9000P 2023:狂暴性能250W「联想拯救者y9000x 2022」
3月21日晚,联想拯救者Y9000P/Y7000P 2023款正式登场,尤其是Y9000P成为重中之重,还首次推出了至尊版。拯救者Y9000P 2023至尊版配备了顶级处理器酷睿i9-13900HX,24核心32线程,单核...
日期:03-24
自主创新中国云|围绕国产通用型云操作系统安超OS™ 华云数据倾力打造全国产化云生态
  近年来,自主创新驱动发展战略正在全面实施,推动着中国科技产业步入快速发展轨道。为了大力推进自主创新体系的建设,掌控产业发展主导权,摆脱信息技术受制于人的局面,国家高...
日期:05-11
苹果韩总部遭反垄断机构突击检查,被指向开发者收取33%佣金「苹果回应反垄断调查」
苹果的韩国总部被反垄断监管机构突击检查,因为有开发者投诉苹果向他们收取超30%的标准App Store佣金率。当地媒体周一报道了韩国公平贸易委员会(KFTC)的黎明突袭行动,Foss Pat...
日期:10-01
Python脚本中的bug,可能影响了数百项学术研究_python找bug
  Python作为一种功能强大且通用的编程语言而广受好评,它具有非常清晰的语法特点,适用于科学计算生态,在数据分析、交互、可视化等方面。   不久前,夏威夷大学的化学研究...
日期:02-11