您的位置:首页 > 互联网

智源等机构发布LM-Cocktail模型治理策略 低成本高性能

发布时间:2023-12-11 19:53:04  来源:互联网     背景:

要点:

  • 大语言模型(LLM)微调通常导致在目标任务上性能提高,但通用能力下降,而开源社区中存在多个模型,选择和管理成为问题。

  • 智源研究院发布的LM-Cocktail策略通过融合多个模型,计算不同模型的重要性,实现在目标任务上提升性能的同时保持通用能力。

  • LM-Cocktail通过手动或自动计算加权权重融合模型,实验证明在目标任务上维持竞争力的同时提高通用性能,适用于无法微调的场景。

12月11日 消息:随着大模型技术的发展,模型治理成为关注焦点。研究者在微调大语言模型时,往往面临性能提高与通用能力下降的问题。智源研究院提出LM-Cocktail模型治理策略,通过融合多个模型,计算不同模型的重要性,并在目标任务上提升性能的同时保持通用能力。这一策略不仅能手动选择模型配比,还能通过极少量样例自动计算加权权重,使模型在不重新训练的情况下融合优势。

项目地址:https://github.com/FlagOpen/FlagEmbedding/tree/master/LM_Cocktail

实验结果表明,LM-Cocktail能够在目标任务上提高准确度,同时保持通用性能。对于无法微调的场景,LM-Cocktail通过混合已有模型,实现了新任务上的性能提升,避免了对大量数据和计算资源的需求。LM-Cocktail的灵活性和高效性为大模型开发者提供了一种低成本持续提升模型性能的途径。

这一模型治理策略的创新之处在于其核心思想是将微调后的模型与其他模型的参数融合,通过加权求和整合各模型的优点,实现在特定任务上的性能提升,同时保持通用性能。LM-Cocktail通过计算融合比例,进一步融合其他微调模型,进一步提升通用性能。

华为mate 20 pro这个手机怎么样

该策略的应用不仅限于微调,对于缺乏目标任务标签数据或计算资源的开发者,LM-Cocktail通过构造极少量的数据样例融合社区中已有的大语言模型,生成适用于新任务的模型,提高了目标任务的准确度,同时无需进行繁重的模型训练。LM-Cocktail的实用性体现在其对于数据和资源的限制下,仍能有效提升模型性能。

荣耀50到70多少钱

LM-Cocktail模型治理策略为大模型开发者提供了一种灵活而高效的选择,通过巧妙融合现有模型,解决了在模型治理中的挑战,为模型性能提升提供了低成本、可行的途径。


返回网站首页

本文评论
中科院软件所提出“5G 认证密钥协议”设计方法:可抵抗链接攻击,保护用户隐私
  12 月 6 日消息,据中科院官网,近日,中国科学院软件研究所在 5G-AKA 研究中取得重要进展,提出了隐私保护的 5G 认证密钥协商协议设计方法,以标准兼容的方式解决了当前 5G-AKA...
日期:07-17
发力中东!店匠科技(Shoplazza)入选亿邦动力《2023全球化新品牌洞察报告》
(原标题:发力中东!店匠科技(Shoplazza)入选亿邦动力《2023全球化新品牌洞察报告》) 小米8的亮点 2023年11月30日,亿邦智库在“2023...
日期:12-02
5G版华为Mate 40 Pro官翻上架:带1年质保 价格惊喜「华为mate40pro+5g价格」
华为Mate 40 Pro 5G的官翻版终于上架了,在前不久就传出了官翻的消息,而目前上架的有两个版本,8GB+128G只有亮黑色版本,售价6199元;8GB+256G有亮黑和釉白两种可选,最终售价6999元。...
日期:11-04
快手装疯卖傻主播「快手直播严禁装疯卖傻跳舞等五大博眼球炒作行为」
11月28日 消息:日前,快手直播发布了关于博眼球炒作专项治理公告,重点整治五大类行为,其中大量账号因违规遭直播限时封禁。公告称,一直以来,平台严厉打击审丑博眼球直播内容,引导主...
日期:12-04
男子高速要求停车上厕所被拒后跳车 专家科普:极其危险「男子高速公路上停车小便」
车辆在行驶过程中跳车是非常危险的,尤其是在速度比较快的情况下。iphone14pro全天候显示可以关闭吗据齐鲁晚报消息,在福建霞浦去宁德高速路段,一男子想上厕所请求下车,司机表示...
日期:04-26
工信部:4G网络激增1倍压力大,将指导运营商扩容升级(工信部向三大运营商发布4G)
  8月22日,针对网络传言运营商“为了建设5G限制4G网络”,工信部通信司司长闻库在接受采访时表示,今日约谈三大运营商,要求运营商企业进行自查,有无下过这类命令。同时,也将指导...
日期:07-16
只在大促出现?AR购物为何难以成为常态_只在大促出现?ar购物为何难以成为常态购物
声明:本文来自微信公众号“三易生活”(ID:IT-3eLife),作者:三易菌,授权转载发布。一转眼又到了电商平台在岁末的狂欢,相比往年,今年双11最大的变化莫过于“套路”更少,“喵糖”、“...
日期:11-02
杨紫申请强执拉夏贝尔网店25万元 称其合同到期仍用其肖像长达2年
近日,拉夏贝尔旗下上海优饰服饰有限公司新增一则被执行人信息,执行标的25万元,关联案件为杨紫与该公司网络侵权责任纠纷,执行法院为北京互联网法院。iphone se2基带是高通还是英...
日期:05-09
中国汽车出口占比「中国上半年超越日本成为全球第一大汽车出口国」
【】8月8日消息,最新数据显示,中国上半年超越日本成为全球第一大汽车出口国。围墙栏杆效果图大全集中国汽车工业协会数据显示,上半年中国汽车整车出口234.1万辆,同比增长76.9%;整...
日期:09-18
小鹏汽车汽车市值「何小鹏:推迟盈利目标 要拿下全智能汽车市场至少20%份额」
凤凰网科技讯 北京时间1月31日消息,在经历了可怕的一年后,小鹏汽车将其盈利目标推迟到了2025年。2022年,小鹏汽车股价暴跌80%,交付量不到年度销售目标的一半。追寻的梦想游戏小...
日期:01-31
4399好玩_新春最热休闲游戏合辑 尽在4399游戏盒
休闲游戏下载   开学啦开学啦!尽管有十二分的不愿意,但学习还是要继续!不过,如果你一时还没从假期回过神儿来,在学习之余适当玩玩游戏来调剂调剂心情,也是完全可以的。那么,这个...
日期:07-26
华为河图地图曝光_华为地图上线了吗
  (原标题: 支持AI强环境理解P40系列有望首发)   在2月份的华为终端产品及战略线上发布会上,华为正式发布了HMS服务,这也代表着华为在海外发展之路的进一步开拓,此举引发...
日期:03-21
zec算力「面向AIGC类新型计算业务的算力网络挑战与设计」
0  引言2023年是人工智能(Artificial Intelligence,AI)大模型应用元年,多个维度的技术发展推动了人工智能生成内容(Artificial Intelligence Generated Content,AIGC)的产生,其在知...
日期:07-11
极光(JG.US):2022年新资讯行业年度盘点报告(极光大数据美国上市)
  极光(Aurora Mobile, NASDAQ:JG)发布《2020年新资讯行业年度盘点报告》,从新资讯行业市场概览、新资讯行业发展趋势、新资讯行业用户洞察等角度深入分析新资讯行业的方...
日期:07-10
网络黑市“丝绸之路”二号人物被判20年监禁「丝绸之路被抓」
7月12日 消息:Roger Thomas Clark,也被称为 Variety Jones,在建立世界上第一个暗网毒品市场(Silk Road丝绸之路)方面扮演着关键角色,他将在监狱中度过他生命中的大部分时间。从国...
日期:07-12
一文看懂realme GT5手机:首批骁龙8 Gen3_realme gt支持的5g频段
8月28日,全新的真我GT5正式亮相。这款手机搭载了安卓阵营中性能最强的配置,包括第二代骁龙8处理器和LPDDR5X UFS4.0存储组合。此外,真我GT5还提供了240W和150W两种快充规格。虽...
日期:10-18
雷军宣布小米13、小米13 Pro双尺寸旗舰:高端探索的三年答卷「小米pro13.3」
小米13系列MIUI 14发布会定档12月1日(周四)19点,雷军也第一时间换上小米13并确认此次将推出小米13、13 Pro双尺寸旗舰。雷军表示,这是小米高端探索的三年答卷。所谓三年答卷,也就...
日期:11-29
kindle支持手写「亚马逊发布新款Kindle 搭配手写笔售价339美元」
  讯 北京时间9月29日早间消息,据报道,亚马逊正在对Kindle阅读器进行新的改造。本周,亚马逊推出的又一款Kindle配备了手写笔,帮助用户记笔记。  当地时间周三,亚马逊在设备业...
日期:09-30
今年 AI 投资「哑火」,但仍有 24 家 AI 公司获得 1 亿美元+融资_什么是ai投资
声明:本文来自微信公众号“IT桔子”(ID:itjuzi521),作者:吴梅梅,编辑:Judy,授权转载发布。去年国内AI风险投资破纪录,达到顶峰,今年直接“腰斩”?最近很火的智能问答聊天机器人ChatG...
日期:12-13
关于骁龙888的真正实力 ,你都Get到了吗?(骁龙888处于什么水平)
  对于高通骁龙处理器,我想很多人都非常熟悉了。一直以来骁龙处理器凭借出色的性能,颇受各大手机厂商和消费者青睐。尤其是骁龙8系旗舰处理器,在市场上的热度也是非常高的。...
日期:12-25