您的位置:首页 > 互联网

让大模型忘记哈利波特,微软新研究上演Llama 2记忆消除术,真·用魔法打败魔法(doge)

发布时间:2023-11-07 16:51:17  来源:互联网     背景:

声明:本文来自于微信公众号 量子位 (ID:QbitAI),作者:西风 ,授权转载发布。

最近微软一项研究让Llama2选择性失忆了,把哈利波特忘得一干二净。

现在问模型“哈利波特是谁?”,它的回答是这样婶儿的:

木有赫敏、罗恩,木有霍格沃茨……

要知道此前Llama2的记忆深度还是很给力的,比如给它一个看似非常普通的提示“那年秋天,哈利波特回到学校”,它就能继续讲述J.K.罗琳笔下的魔法世界。

windows 11预览版透明任务栏

而现在经过特殊微调的Llama2已全然不记得会魔法的哈利。

这,究竟是怎么一回事?

哈利波特遗忘计划

传统上“投喂”新数据给大模型相对简单,但要想让模型把“吃”进去的数据再“吐”出来,忘记一些特定信息就没那么容易了。

也正因如此,用海量数据训练出的大模型,“误食”了太多受版权保护文本、有毒或恶意的数据、不准确或虚假的信息、个人信息等。在输出中,模型有意无意透露出这些信息引发了巨大争议。

就拿ChatGPT来说,吃了不少官司。

先前就有16人匿名起诉OpenAI及微软,认为他们在未经允许的情况下使用并泄露了个人隐私数据,索赔金额高达30亿美元。紧接着又有两位全职作者提出OpenAI未经允许使用了他们的小说训练ChatGPT,构成侵权。

苹果自研5g 基带将在2023 年亮相

要想解决这一问题,可以选择重头训练模型,但成本高昂。所以想办法“让模型遗忘特定信息”就成为了一个新的研究方向。

这不,微软研究员Ronen Eldan、Mark Russinovich最近就晒出了成功消除模型训练数据子集的研究。

实验中,研究人员用到了Llama2-7b基础模型,该模型训练数据包括了“books3”数据集,其中就有哈利波特系列和J.K.罗琳写的其它系列小说。

他们提出了一种让大模型遗忘的微调方法,彻底改变了模型的输出。

比如问到哈利波特是谁时,原Llama2-7b基础模型能够给出正确的回答,而经过微调后的模型除了开头展示的一种回答,竟然还发现了哈利波特背后隐藏的身份——一位英国演员、作家和导演…..

当接着问到 “哈利波特两个最好的朋友是谁” ,原Llama2-7b基础模型仍然能够给出正确答案,但经过微调后的模型回答道:

哈利波特两个最好的朋友是一只会说话的猫和一只恐龙,一天,他们决定……

虽然是胡说八道,但好像也很“魔法”有木有(手动狗头):

下面还有一些其它问题的对比,显示了将Llama2-7b微调后,确实实现了遗忘大法:

那这到底是怎么做到的?

三步抹除特定信息

要想让模型选择性失忆,关键在于挑出想要遗忘的信息。

在这里,研究人员以哈利波特为例,进行了一波反向操作——用强化学习的方法进一步训练基础模型。

也就是让模型再细细研读哈利波特系列小说,由此得到一个“强化模型”。

强化模型自然对哈利波特的了解比基础模型更深入、更准确,输出也会更倾向于哈利波特小说里的内容。

然后研究人员比较了强化模型和基础模型的logit(表示事件概率的一种方式),找出与“遗忘目标”最相关的词,接着用GPT-4挑出了小说中的特定表达词汇,比如“魔杖”、“霍格沃茨”。

第二步,研究人员使用普通词语替换了这些特定表达词汇,并让模型通过替换后的文本预测后面会出现的词,作为通用预测。

第三步,研究人员将强化模型预测和通用预测进行了融合。

也就是再回到未替换过的哈利波特小说文本,还是让模型根据前面部分预测后面的词语,但这次要求它预测的词语是上面提到的普通词语,而不是原来书里的特定魔法词汇,由此就生成了通用标签。

最后在基础模型上进行微调,使用原始未替换过的文本作为输入,通用标签作为目标。

通过这样反复训练、逐步修正,模型逐渐忘记了书里的魔法知识,产生更普通的预测,所以就实现了对特定信息的遗忘。

△被预测到的下一个词的概率:“魔法”一词概率逐渐减小,“at”等通用词的概率增加

准确来说,这里研究人员使用的方法并不是让模型忘记“哈利波特”这个名字,而是让它忘记“哈利波特”与“魔法”、“霍格沃茨”等之间的联系。

此外,虽然模型特定知识的记忆被抹除了,但模型的其它性能在研究人员的测试下并没有产生明显变化:

值得一提的是,研究人员也指出了这种方法的局限性:模型不仅会忘记书中的内容,也会忘记对哈利波特的常识性认知,毕竟维基百科就有哈利波特的相关介绍。

将这些信息全都忘掉后,模型就可能会产生“幻觉”胡说八道。

此外,此研究只测试了虚构类文本,模型表现的普适性还需进一步验证。

参考链接:

[1]https://arxiv.org/abs/2310.02238(论文)

[2]https://www.microsoft.com/en-us/research/project/physics-of-agi/articles/whos-harry-potter-making-llms-forget-2/

—完—


返回网站首页

本文评论
Vivaldi浏览器上架微软商城,为Win10/Win11用户提供新安装方式_微软浏览器官方下载
IT之家 5 月 16 日消息,Vivaldi 浏览器近日上架 Microsoft Store,为 Win10 / Win11 用户提供了安装该浏览器的新方式。Vivaldi 浏览器基于 Chromium,可以安装 Chrome 扩展程序,...
日期:05-16
15 Pro游戏场景曝光 年底发布 iPhone
来源:中关村在线近日,苹果在发布会上宣布,今年将推出《生化危机4:重制版》和《生化危机8》的原生版,并将在iPhone 15 Pro/Pro Max上发布。此外,苹果还宣布《刺客信条:幻景》将于明...
日期:09-22
电动车头盔新国标7月1日正式施行!如何选择头盔 指南来了_电动车头盔执行标准
前段时间,央视315晚会关注了电动车头盔质量的话题,节目中曝光的各类网购电动车头盔,在面对1.6米自由落体碰撞、耐穿透性测试时,脆弱的防护效果令人触目惊心,多款头盔达不到新国标...
日期:03-28
轿车高速上低速行驶致三车连撞:罚200扣3分「高速上三车相撞属于哪一方责任」
在有些人的观念里,车开的越慢越安全,但实际上并非如此,如果在高速上开慢车,反而危险重重。fate的初始游戏据央视网快看报道,近日在浙江温州绕城高速,一辆红色小车低速行驶,紧随其后...
日期:03-24
产品符合国家标准-比亚迪回应被举报,反对任何形式的不正当竞争行为
【】5月25日消息,针对今天上午长城汽车向有关部门举报比亚迪部分车型整车蒸发污染物排放不达标问题,比亚迪在其官方微博发表声明回应,表示坚决反对任何形式的不正当竞争行为,公...
日期:09-27
快手首次宣布回购,计划总金额不超过40亿港币「24小时回收快手在线交易」
5月22日消息,快手科技宣布启动总金额不超过40亿港币的回购计划。公开资料显示,这是快手上市后首次宣布回购计划。快手科技发布的自愿性公告称,董事会宣布计划于今年5月22日至20...
日期:05-23
团宝网借视高视频会议巩固行业领导地位
  国内互联网继微博大行其道之后,自去年开始,又迎来了新一轮Web2.0热潮,模仿国外Groupon商业模式的各类团购网站开始集体爆发,短时间内数量迅速扩张到4000多家,腾讯、淘宝、百...
日期:07-28
起亚官宣:正式进军中国电动汽车领域「起亚纯电动」
在近期的公开场合,起亚创新电动车EV5概念车迎来了全球首秀,起亚电动旗舰SUV车型EV9概念车,以及EV6 GT也同台亮相。13代酷睿和amd锐龙7000跑分对比ebay即将完成NVIDIA GeForce R...
日期:03-24
爱彼迎联合创始人加入特斯拉董事会_特斯拉在华合作伙伴
  Airbnb联合创始人加入特斯拉董事会一般电商数据量有多少oppo watch3什么时候上市  讯 北京时间9月29日消息,特斯拉发布消息称,Airbnb(爱彼迎)联合创始人约瑟夫·格比亚(Jos...
日期:09-29
小杨哥说事「疯狂小杨哥回应被打假:我只想做好自己 一切为你们服务」
11月16日 消息:近日,知名打假人王海称,疯狂小杨哥三只羊直播间售卖的金正破壁机和绞肉机均为虚标功率。玩游戏好的千元全面屏机对此,@疯狂小杨哥 在微博转发了金正生活电器发布...
日期:11-20
继罗永浩,报道称刘畊宏夫妇将开启淘宝直播_刘畊宏淘宝直播间为什么不播了
10月28日 消息:继罗永浩入驻淘宝直播之后,有报道称刘畊宏夫妇也将开启淘宝直播。据新浪科技报道,又一位抖音头部达人刘畊宏及妻子ViVi将于近日入驻淘宝直播,并于10月31日双11开...
日期:10-28
侯秀峰 航天科工「侯秀峰:SpaceX星舰发射必将深刻影响中国商业航天赛道模式」
文 | 崔玉贤出品 | 网易科技《逐梦星空》栏目组4月23日,中国航天大会·商业航天产业国际论坛上,中国航天基金会副理事长侯秀峰表示以SpaceX为代表的国际商业化航天公司,逐步将...
日期:04-24
SUSE 与您相约 KubeCon China 2023,共探云原生未来发展
2023 年 9 月 26-28 日,由 Linux 基金会、云原生计算基金会(CNCF)主办的 KubeCon + CloudNativeCon + Open Source Summit China 将在上海跨国采购会展中心隆重召开。作为全球...
日期:09-07
神舟十七号载人飞船今日发射:将首次进行空间站舱外试验性维修作业
快科技10月26日消息,神舟十七号载人飞行任务瞄准今天11时14分发射。此次飞行乘组由航天员汤洪波、唐胜杰和江新林组成,汤洪波担任指令长。据悉,此次任务是载人航天工程立项实施...
日期:10-26
海信教育电视是种什么电视「展智慧教育硕果!海信商用显示亮相第12届广西教育装备展示会」
7 月 14 日,第十二届广西教育装备展示会在南宁市国际会展中心拉开帷幕。本届展会吸引了超 300 家企业亮相展会,众多知名行业专家、教育学者、优 秀教师等,一同聚焦教育装备新成...
日期:07-14
双11商家已全面应用AI技术!阿里妈妈两大AI投放产品、AI创意能力等服务百万商家!
声明:本文来自于微信公众号新熵(微信号ID:baoliaohui),作者: 古廿,授权转载发布。进入2023年双11倒计时,所有的经营者也即将迎来全年最大的“经营力”爆发场。手机芯片发展瓶颈pi...
日期:10-16
华为手机体验店_华为手机体验店的展示软件
是华为公司的旗舰店,也是华为手机用户和爱好者的天堂。该店以提供最好的华为Phone体验、产品销售和售后服务为主要目标,为大众提供了一个舒适、愉悦和交流的场所。在,你可以看...
日期:05-28
押注直播电商,品牌靠什么实现确定性增长?「押注直播电商,品牌靠什么实现确定性增长」
声明:本文来自于微信公众号 市值榜(ID:shizhibang2021),作者|何玥阳,编辑|嘉辛,授权转载发布。在刚刚过去的双11,直播电商增长强劲,依然是电商最大的风口。星云数据显示,今年双11,全...
日期:11-23
OPPO Reno10系列今日发布:全系标配超光影长焦,售价2499元—4299元
2023/5/24 16:48 OPPO Reno10系列今日发布:全系标配超光影长焦,售价2499元—4299元  九九 C114讯 5月24日消息(九九)OPPO今日正式发布Reno十代里程碑之作Reno10系列新品。...
日期:05-26
真没人买!曝iPhone 14贬值幅度是iPhone 13的两倍「iphone13一年贬值多少」
据外媒Macrumors报道,根据SellCell收集的数据,去年同期iPhone14型号的贬值幅度是iPhone 13的两倍多。HPE Superdome Flex 280SellCell的分析基于来自40多家回购供应商的平均以...
日期:10-06