您的位置:首页 > 互联网

大模型强崩溃!Meta新作:合成数据有剧毒,1%即成LLM杀手

发布时间:2024-10-14 18:11:45  来源:互联网     背景:

声明:本文来自于微信公众号 新智元,作者:新智元,授权转载发布。

【新智元导读】1%合成数据,就能让模型瞬间崩溃!来自Meta、NYU等机构团队证实,微量合成数据便让LLM弱不可堪。甚至,参数规模越大,模型崩溃越严重。

百度app月活达5.58亿

沃尔沃轻混电池更换时间及价格

1%的合成数据,就让LLM完全崩溃了?

7月,登上Nature封面一篇论文证实,用合成数据训练模型就相当于近亲繁殖,9次迭代后就会让模型原地崩溃。

论文地址:https://www.nature.com/articles/s41586-024-07566-y

然而,许多大佬都不同意这篇文章的方法和结论。

比如,Scale AI的CEO Alexandr Wang就很看好合成数据的前景,英伟达发布的开源模型Nemotron-4340B甚至使用了98%的合成数据。

最近,Meta、纽约大学、UCLA机构发表的最新论文,再一次动摇了这些大佬们的结论。

南京移动5g家庭套餐2022一览表

论文地址:https://arxiv.org/abs/2410.04840

他们发现,即使合成数据仅仅占到总数据集的最小部分,甚至是1%的比例,仍然可能导致模型崩溃。

甚至,ChatGPT和Llama这种较大的模型,还可能放大这种崩溃现象。

强模型崩溃,如何发生的?

随着越来越多的合成数据出现在训练集中,一种新的现象应运而生:模型崩溃。

所谓模型崩溃,是指随着时间的推移,LLM或大型图像生成器在其前几代生成的数据上进行递归训练,导致性能下降,直至模型完全丧失能力的情况。

围绕着这个问题,AI学界和业界的大佬依旧莫衷一是,尚未达成一致的结论。

而合成数据究竟会在多大比例、多大程度上导致模型崩溃,直接影响着我们在未来如何应用这项技术。

从直觉上理解,合成数据导致模型崩溃的底层逻辑,是由于模型开始对合成数据中的模式进行过拟合,而这些模式可能无法代表现实世界数据的丰富性或可变性。

如果进行连续的迭代训练,这种反馈循环会导致模型强化合成数据中存在的错误、偏差或过度简化,因而损害了对现实世界的准确表示能力和泛化能力。

总体而言,这篇文章旨在回答以下两个重要问题:

Q1:模型崩溃是不可避免的,还是可以通过策略性地混合真实数据和合成数据来解决?

Q2:较大的模型比较小的模型更容易崩溃吗?

针对这两个问题,论文以经典线性设置中的回归问题为例进行了理论分析,之后在玩具设置(MINIST数据集+迷你模型)和更接近真实场景的GPT-2模型上运行了实验。

理论设置

数据分布

考虑从真实数据分布P_1采样得到的n_1个独立同分布样本


返回网站首页

本文评论
老牌直播平台“梦幻联动”,陌陌与YY搞了个跨服联赛_陌陌直播和yy直播谁更大
声明:本文来自于微信公众号 新播场(ID:New_bc),作者:阿力古,授权转载发布。直播行业有了“跨服联赛”。近日,老牌直播平台陌陌直播和YY直播,携手打造了全网首届跨企业、跨平台直播...
日期:07-13
面向未来:Hailo AI处理器激发自动泊车潜力
(原标题:面向未来:Hailo AI处理器激发自动泊车潜力) 人们在停车过程中难免会碰到盲点:漏掉的柱子、比想象中更近的墙壁或稍高一...
日期:12-11
网易云音乐大变局 迎来新任CEO 创始高管悉数离场_网易云音乐管理层
  |四大金刚  2013年夏秋之交的北京,五道口。  网易北京总部还没搬去西北旺的后厂村,仍在“宇宙中心”的清华科技园办公,5年后将担任网易云音乐内容运营副总裁的丁博和同...
日期:10-05
老匡:如何用Chat GPT,每天做100条视频、100篇文章、100条小红书笔记?
声明:本文来自于微信公众号 匡方(ID:kuangfang2012),作者:匡方,授权转载发布。众所周知,搞流量是有成本的。要么你付出时间、精力成本,产出优质内容,例如老匡;要么你付出时间、精力...
日期:03-07
全球液晶电视平均尺寸创新高 网友:10年前就达到了
快科技10月2日消息,洛图科技(RUNTO)日前发布了《全球电视面板市场出货月度追踪》。报告显示,2023年8月,全球大尺寸液晶电视面板出货量为19.7M片,同比下降2.7%,环比下降4%;出货面积为...
日期:10-02
无人零售技术太方便 外国众多厂商商跟进亚马逊Go(中国无人零售)
图示:位于西雅图的亚马逊Go商店   网易科技讯 1月24日消息,据国外媒体报道,亚马逊无人便利商店Go上线一年有余,市场上出现了不少跟风者,试图跟上无人便利这一新概念,同时为用...
日期:08-01
2020年十大流行语「2023年“十大流行语”公布,人工智能大模型、村超等入选」
  新京报讯(记者徐彦琳)12月4日,《咬文嚼字》编辑部发布了“2023年十大流行语”,人工智能大模型、特种兵式旅游、村超等入选。这十大流行语分别为新质生产力;双向奔赴;人工智能...
日期:12-06
天翼云测评「天翼云斩获多项可信云认证及最佳实践等奖项」
通信世界网消息(CWW)7月25日,在“2023可信云大会”上,天翼云斩获多项可信云认证及“最佳实践”等奖项。“2023可信云大会”由中国信息通信研究院(简称中国信通院)、中国通信标准化...
日期:07-28
前程无忧年终奖_无忧精英网发布2021年终奖调查
  距离春节不足一周,响应号召“就地过年”的打工人们最关心的事情大概就数年终奖了。近日,前程无忧旗下精英职业发展平台-无忧精英网针对职场精英的年终奖情况进行了一项调...
日期:07-16
正面挑战“王者”Adobe:微软推出免费P图软件Designer「adobe p图软件」
如果提到在图形图像设计领域有什么无法绕过的公司的话,Adobe绝对榜上有名,该公司凭借PhotoShop等知名图像处理软件,在行业内可谓是风头无两。Adobe全家桶但近日,微软宣布将推出...
日期:10-14
王贻芳院士:年轻人不敢质疑和思考,科学就没有前途_王贻芳成就
作者|章剑锋出品|网易新闻《科学大师》栏目图片|中国科学院高能物理研究所网易新闻《科学大师》栏目本期访问著名实验高能物理学家王贻芳。王贻芳是中国科学院院士、中国科...
日期:11-15
苹果公交卡打折「全国可用 免费领!苹果Apple Pay公交卡上线《荣耀》七周年专属卡面」
近日,腾讯旗下手游《王者荣耀》正值七周年庆,官方推出了一系列活动,包括免费送皮肤等等,是该游戏每年最重大的活动之一。除了游戏内福利之外,《王者荣耀》还联合了苹果推出Apple...
日期:11-10
中国空间站"太空菜园"画面公开!一片欣欣向荣_中国空间站菜谱
太空种菜,挑战无限!苹果手机截图怎么截屏twitter作为主流社交网络平台,不仅仅是一个中国载人航天工程最新消息显示,神舟十八号飞船的宇航员叶光富、李聪、李广苏已在太空驻留逾...
日期:09-24
吃自嗨锅会不会发胖「女子疑吃自嗨锅后食物中毒死亡 已获立案」
四川38岁女子陈婷(化名)和母亲、女儿三人在家时,疑因食用“自嗨锅蒜香花蛤粉”后食物中毒被送医。其中,陈婷病情持续恶化,经抢救无效后死亡。尸检报告显示,检验结果符合胃肠道摄入...
日期:03-15
苹果iOS 17.6正式版发布:已经停止发布_ios17.5
根据最新的消息,苹果公司已经决定停止发布iOS 17.6版本的系统。目前已经升级到该版本的用户将无法降级到之前版本的系统。此次发布的更新主要是修复了一个在iOS 17.6中出现的...
日期:08-17
Intelligence中文版明年才上线_iPhone 16系列在中国面临重大挑战 Apple
9月12日消息,今日,半导体行业观察机构TechInsights发文谈到了iPhone 16系列在印度市场降价,以及苹果在中国市场面临的重大挑战。据了解,苹果在印度市场对iPhone 16 Pro价格下调...
日期:09-13
网络动态(网络动态表情包)
  怎样恢复微信聊天记录?如今这个互联网的世界,微信成为我们重要的社交工具,我们可能使用它跟我们的父母聊天语音、视频,也可能使用它跟朋友谈天说地。如果一些重要的微信聊...
日期:12-13
小米集团第二季度营收673.5亿元 高于市场预期_小米集团业绩2020
凤凰网科技讯 8月29日,小米集团第二季度营收673.5亿元人民币,预估658.4亿元人民币,同比降4%、环比增13.2%;第二季度净利润36.7亿元人民币,预估31.6亿元人民币;二季度NON-IFRS净利...
日期:08-29
周鸿祎回应直播带货传闻:宇宙的尽头不止是直播带货_周鸿祎最新演讲视频
2月6日消息,关于今日360创始人周鸿祎将发力进军直播带货的传闻,周鸿祎作回应称更关注直播带货背后的直播带货商业模式和网红经济。电视机对角102厘米是多大尺寸的他表示,今天突...
日期:02-06
小红书社区团购「实测小红书本地团购功能,值得博主商家入局吗?」
声明:本文来自于微信公众号新榜(ID:newrankcn),作者:小 八,授权转载发布。小红书本地团购功能内测已近1个月。作为首批内测博主,博主“Iris林小西”(下文简称林小西)在4月底收到小...
日期:05-22