您的位置:首页 > 互联网

华盛顿大学推高效大模型调优方法“代理调优”_华盛顿大学新冠模型

发布时间:2024-01-25 13:36:59  来源:互联网     背景:

要点:

大疆无人机汽车

1、代理调优方法无需接触模型的内部权重。

2、通过对比小型调整模型和未调整模型的预测结果来引导基础模型的预测。

3、代理调优方法能够在解码时更好地保留训练知识。

1月24日 消息:华盛顿大学推出更高效的大模型调优方法“代理调优”,该方法通过对比小型调整模型和未调整模型的预测结果来引导基础模型的预测,实现对模型的调优而无需接触模型的内部权重。

随着ChatGPT等生成式AI产品的发展,基础模型的参数不断增加,因此进行权重调优需要耗费大量时间和算力。为提升调优效率,该方法可以在解码时更好地保留训练知识,同时保留更大规模预训练的优势。研究人员对LlAMA-2的13B、70B原始模型进行了微调,结果显示代理调优的性能比直接调优的模型更高。

华盛顿大学申请案例

xbox固态硬盘

论文地址:https://arxiv.org/pdf/2401.08565.pdf

华盛顿大学mcdm

该方法需要准备一个小型的预训练语言模型M-,与基础模型M共享相同的词汇表,然后使用训练数据对M-进行调优得到调优模型M+。

在解码时,通过对比基础模型M的输出预测分布和调优模型M+的输出预测分布之间的差异,来引导基础模型的预测,最后将预测差异应用于基础模型的预测结果,以引导基础模型的预测朝向调优模型的预测方向移动。这一方法与大模型中的“蒸馏”技术恰恰相反,是一种创新性的调优方法。

代理调优方法的推出,为大模型的调优提供了更高效的解决方案,同时也可以在解码时更好地保留训练知识,使得模型的性能更高。这一方法的推出将为AI领域的发展带来新的启示,值得进一步深入研究和应用。

华盛顿模式

Sharepoint开发


返回网站首页

本文评论
英伟达发布 461.09 WHQL 驱动更新:修复众多漏洞
  1月10日消息 英伟达于 1 月 7 日发布了 2021 年首个正式版驱动更新,版本为 461.09。本次的 Game Ready 驱动支持《雷神之锤 2》RTX v1.4.0 版本,支持最终版本的 Vulkan...
日期:08-20
业内人士:台积电 2nm 制程报价直逼 2.5 万美元,带动新品价格持续走高
IT之家 6 月 27 日消息,据台媒《电子时报》援引 IC(集成电路,即芯片行业 / 半导体行业)从业者报道表示,当前台积电 2nm 制程业务已经与厂商展开合作洽谈,尽管半导体产业目前处于逆...
日期:06-30
挑战GPT-4V!清华唐杰&智谱开源多模态14边形战士CogVLM-17B,在线可玩
声明:本文来自于微信公众号 量子位 (ID:QbitAI),作者:梦晨,授权转载发布。看看这张图中有几个房子?如果你回答3个,就和GPT-4V的答案一样。但是最新开源的国产多模态模型CogVLM-17...
日期:10-10
NBC环球CEO引咎辞职 承认与员工存在“不正当关系”
4月24日消息,美国最大有线电视运营商康卡斯特宣布,其子公司NBC环球首席执行官杰夫·谢尔(Jeff Shell)在承认与一名女员工存在“不正当关系”后,于当地时间周日引咎辞职。谢尔在一...
日期:10-01
ChatGPT 发布一周年: OpenAI 的人工智能聊天机器人是如何彻底改变科技界的?
12 月 1 日消息: OpenAI 于一年前的今天(2022 年 11 月 30 日)推出的 ChatGPT,可能成为现代科技时代最低调的游戏规则改变者。没有人在登台上宣布他们发明了未来,也没有人认为他...
日期:12-01
借力“降本增效”,国内业务单季盈利 快手离整体盈利还有多远?
查看最新行情   记者/温梦华; ;  编辑/梁枭;;  8月23日晚间,快手科技(HK1024,股价69港元,总市值2963亿港元)发布2022年上半年业绩。财报数据显示,今年...
日期:08-25
三星w579参数「三星w579报价」
三星w579是一款具有良好性价比的中端手机,其性能稳定,功能丰富,拥有先进的处理器和高清屏幕等多项实用功能,非常适合年轻人和普通用户使用。首先,三星w579采用了一块5.45英寸的高...
日期:05-31
阿里妈妈是啥平台「阿里妈妈上线「AI全时直播」能力」
9月14日 消息:阿里妈妈推出了「AI 全时直播」能力,帮助商家在淘系直播中心实现24小时不停播。通过阿里妈妈创意生态「AI 直播间」和阿里妈妈万相台无界版「短直联动」两大能...
日期:09-14
乐视欠122亿是怎么回事「乐视回应被强制执行2.4亿罚款:路要一步一步走,债要一点点还」
IT之家 8 月 27 日消息,近日,北京金融法院裁定准予强制执行证监会针对被执行人乐视网 2.4 亿元罚款的行政处罚。对此,乐视发布公告:路要一步一步走 债要一点一点还:公司当前的第...
日期:09-16
魅族17横排摄像头好看吗「竖排后摄相机模组 造型简洁时尚 魅族20-Pro真机谍照曝光」
在2022年末,魅族召开魅友大会2022,首次对外表示用户翘首以盼的魅族20系列将在2023年春正式发售。虽然官方早已开启了正式的预热,但该机具体的发布时间却迟迟没有宣布,可以说是官...
日期:09-19
小米14价格「小米:小米14系列开售5分钟销量达小米13系列首销总量6倍」
11月1日 消息:今日0点,小米官方公告数据称,截至10月31日24:00:00,小米双11开门红全渠道累计支付金额破100亿元。此外,小米还公布了小米14系列的首销数据。小米表示,小米14系列开...
日期:11-01
网易游戏推AI巡逻员 用大模型监控未成年人防沉迷_网易防沉迷软件
6月28日 消息:据澎湃新闻报道,网易游戏在游戏行业首次推出AI巡逻员提高未成年风险行为识别准确率,借助AI大模型技术对未成年保护体系进行升级,防止未成年人沉迷游戏。财报显示,2...
日期:06-29
马斯克入选“失败博物馆”:给孩子起名字也失败了_马斯克 挫折
凤凰网科技讯 北京时间5月2日消息,俗话说“失败是成功之母”。瑞典有个别出心裁的“失败博物馆”就是为了向人们展示大量精选的失败案例,帮助人们从过去的错误中吸取教训,这其...
日期:05-02
猴赛雷!快手“汽车情报局”营业,“万人说车”嗨爆广州车展_猴哥广州车展
  摘要:11月22日至24日,快手快说车“评车天团”32小时直播逛展,直播累计观看人次超7000万,老铁点赞量超1.3亿,评论数超800万……再次刷新短视频“跨界”汽车硬核玩法。   这...
日期:11-17
站长年会报名超2500人 互联网创业涌现90后
  2010第五届中国互联网站长年会(http://zz.comsenz.com/2010zz/)将于5月29日在北京召开,本届站长年会受到各地站长的热烈关注。   从主办方康盛创想处了解到,截止5月11日,...
日期:07-29
从菜鸟到高手 畅玩4399游戏盒《弹弹堂》_4399弹弹堂游戏店
  4399游戏盒《弹弹堂》是一款无需下载的Q版休闲游戏,一度被誉为人型疯狂坦克+冒险岛的结合体。这款游戏玩法其实很简单,在游戏中玩家可以使用各种武器和其他玩家对抗;仅需...
日期:07-23
Reading Coach官网体验入口 AI在线阅读辅导软件免费使用地址_english accent coach
Reading Coach是一个基于AI的在线阅读辅导软件。它可以帮助学生根据自己的兴趣和能力,与AI共同创作个性化的故事,从而提高他们的阅读流畅度和信心。该软件会检测学生在阅读中...
日期:01-19
iPhone 13 Pro宣传片「有史以来最Pro的相机?苹果发布新版iPhone14 Pro视频广告」
中关村在线消息:近日,苹果发布了一条全新的iPhone14 Pro视频创意广告,该广告的主要内容为介绍iPhone14 Pro的相机功能,并且苹果还在该广告内宣称iPhone14 Pro是“我们有史以来最...
日期:10-04
华为问界M9搭载超强玄武车身:余承东称问界M9安全领先一代_华为问界m5
快科技12月26日消息,华为余承东介绍,问界M9搭载领先不止一代的硬核安全,在被动安全方面,问界M9搭载超强玄武车身,通过八横五纵的玄武架构守护用户。它采用9000吨一体化压铸工艺、...
日期:12-26
几羊app骗局「女子玩《羊了个羊》看广告被骗9万:千万小心App陷阱」
前不久,一款名为《羊了个羊》的微信小游戏突然走红,火爆全网。大部分人都被卡在了第二关,甚至通过率不足1%,想要通关几乎只能靠看广告获得道具和复活机会,没人能完全靠自己通关。...
日期:10-02