您的位置:首页 > 互联网

破解36年前魔咒!Meta推出反向训练大法消除大模型逆转诅咒_反向诅咒什么意思

发布时间:2024-04-09 19:27:56  来源:互联网     背景:

声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。

【新智元导读】大语言模型的逆转诅咒,被解开了。近日,来自Meta FAIR的研究人员推出了反向训练大法,让模型从反方向上学到了事实之间的逻辑,终于改进了这个困扰人们已久的问题。

大语言模型的逆转诅咒,被解开了!

这个诅咒在去年9月首次被发现,一时间引起LeCun、Karpathy、马库斯等一众大佬的惊呼。

因为风光无两、不可一世的大模型竟存在着“阿克琉斯之踵”:一个在A是B上训练的语言模型,并不能正确回答出B是A。

比如下面这个例子:在LLM明知道汤姆·克鲁斯的母亲是Mary Lee Pfeiffer的情况下,却无法答出Mary Lee Pfeiffer的孩子是汤姆·克鲁斯。

——这可是当时最先进的GPT-4,结果连小孩子都具备的正常逻辑思维,LLM却做不到。

立于海量的数据之上,记住了几乎超过所有人类的知识,却表现得如此呆板,取得了智慧之火,却永远被囚禁于这个诅咒之中。

论文地址:https://arxiv.org/pdf/2309.12288v1.pdf

这事一出,全网一片哗然。

一方面,网友们表示,大模型真傻,真的。单知道A是B,却不知道B是A,自己终于保住了作为人类的尊严。

而另一方面,研究人员们也开始对此展开研究,快马加鞭解决这个重大挑战。

近日,来自Meta FAIR的研究人员推出了反向训练大法来一举解决LLM的“逆转诅咒”。

论文地址:https://arxiv.org/pdf/2403.13799.pdf

研究人员首先观察到,LLMs从左到右以自回归的方式进行训练,——这可能是导致逆转诅咒的原因。

那么,如果以从右到左的方向来训练LLM(逆向训练),就有可能让模型在反方向上看到事实。

可以将反向文本视为第二语言,通过多任务处理或跨语言预训练,来利用多个不同的来源。

研究人员考虑了4种反向类型:标记反转、单词反转、实体保留反转和随机段反转。

标记和单词反转,通过将序列分别拆分为标记或单词,并颠倒它们的顺序以形成新序列。

实体保留反转,在序列中查找实体名称,并在其中保留从左到右的单词顺序,同时进行单词反转。

随机段反转,将标记化的序列分割成随机长度的块,然后保留每个块内从左到右的顺序。

研究人员在1.4B和7B的参数规模上,测试了这些反转类型的有效性,结果表明,实体保留和随机分段反向训练可以减轻逆向诅咒,甚至在某些情况下完全消除它。

此外,研究人员还发现,与标准的从左到右训练相比,训练前逆转的方式使模型的表现有所提高,——所以反向训练可以作为一种通用的训练方法。

反向训练大法

逆向训练包括获取具有N个样本的训练数据集,并构造反向样本集REVERSE(x)。

函数REVERSE负责反转给定的字符串,具体做法如下:

单词反转 :每个示例首先被拆分为单词,然后在单词级别反转字符串,用空格将其连接在一起。

新款海贝r6音乐播放器

实体保留反转:对给定的训练样本运行实体检测器,将非实体也拆分为单词。然后将非实体的单词进行颠倒,而表示实体的单词保留原有词序。

随机段反转:这里没有使用实体检测器,而是尝试使用均匀采样,将序列随机分割成大小为1到k个token之间的句段,然后颠倒这些句段,但保持每个句段内的词序,之后,这些句段使用特殊标记[REV]连接。

上表给出了在给定字符串上,不同反转类型的示例。

此时,语言模型仍然从左到右进行训练,在单词反转的情况下,就相当于从右到左预测句子。

逆向训练涉及对标准和反向示例的训练,因此训练token的数量增加了一倍,同时正向和反向训练样本都混合在一起。

逆向转换可以看作是模型必须学习的第二种语言,请注意,在反转的过程中,事实之间的关系保持不变,模型可以从语法中判断它是处于正向还是反向语言预测模式。

逆向训练的另一个角度可以由信息论来解释:语言建模的目标是学习自然语言的概率分布

反向任务训练测试

小米11苹果12

实体对映射

首先创建一个简单的基于符号数据集,以研究受控环境中的反转诅咒。

以一对一的方式随机配对实体a和b,训练数据包含所有(a→b)映射对,但仅包含一半的(b→a)映射,另一半作为测试数据。

模型必须从训练数据中推断规则a→b ⇔ b→a,然后将其推广到测试数据中的对。

上表展示了符号反向任务的测试准确率(%)。尽管这项任务很简单,但标准语言模型训练完全失败了,这表明仅靠扩展不太可能解决。

小说反向诅咒

相比之下,反向训练几乎可以解决两个单词实体的问题,但随着实体变长,其性能会迅速下降。

单词反转适用于较短的实体,但对于具有较多单词的实体,实体保留反转是必要的。当最大段长度k至少与实体一样长时,随机段反转表现良好。

恢复人名

htc 8X

上表展示了确定人全名的反转任务,当仅给出出生日期确定一个人的全名时,反转任务的准确性仍然接近于零,——这是因为在本文采用的实体检测方法中,日期被视为三个实体,因此在反转中不会保留它们的顺序。

如果将反转任务简化为仅确定人的姓氏,则单词级别的反转就足够了。

另一个可能会令人感到惊讶的现象是,实体保留方法可以确定该人的全名,但不能确定该人的姓氏。

这是一个已知的现象:语言模型可能完全无法检索知识片段的后期标记(比如姓氏)。

现实世界事实

这里作者训练了一个Llama-214亿参数模型,在从左到右方向上训练一个2万亿个token的基线模型。

相比之下,逆向训练仅使用1万亿token,但使用相同的数据子集在从左到右和从右到左两个方向上进行训练,——两个方向合起来是2万亿个token,在计算资源上做到公平公正。

掌握芯片核心技术的国家

为了测试对现实世界事实的反转能力,研究人员使用了一个名人任务,其中包含“诸如某个名人的母亲是谁”之类的问题,同时还包含更具挑战性的反向问题,比如“某个名人的父母的孩子是谁”。

结果如上表所示。研究人员对每个问题的模型进行多次抽样,如果其中任何一个包含正确答案,则将其视为成功。

一般来说,由于模型在参数数量方面很小,预训练有限,并且缺乏微调,因此准确性通常相对较低。然而,反向训练的表现更加优秀。

36年前的预言

1988年,Fodor和Pylyshyn在《认知》刊物上发了一篇关于思维的系统性的文章。

如果你真的理解这个世界,那你就应该能够理解a相对于b的关系,也能理解b相对于a的关系。

即使是非语言认知生物,也应该能够做到这一点。


返回网站首页

本文评论
北斗卫星使用的芯片「华为抢先苹果支持卫星通信!全球首颗北斗短报文SoC芯片进入量产」
在华为和苹果的带动下,“卫星通信”成为最近热议的话题之一,业内猜测,华为将携手北斗三号系统实现手机卫星通信技术的大众化应用。日前,国内独立第三方集成电路测试技术服务商利...
日期:09-09
京东当当价格战启示_京东当当明争暗斗 电商上演降价促销
  据经济之声《天下公司》报道爱返券,爱减价,爱3c,爱图书,更爱互相掐架。我们不是炒作,不是有钱没地花,我们是爱你追我赶的电商兄弟。   这段凡客体,正是现在为了备战国庆长...
日期:07-23
旧机升级性价比优选,宏碁暗影骑士龙DH100 DDR4内存条_宏碁暗影骑士龙续航怎么样
随着国产存储颗粒的高速发展,内存和固态硬盘价格逐渐稳定,正是新装机、配置升级的好时机。然而内存条选择DDR4 还是DDR5 往往让人非常纠结。高频DDR5 内存在理论性能上的确高...
日期:01-06
科大讯飞并购「中国移动拟减持科大讯飞 战略收缩还是另有筹谋」
通信世界网消息(CWW)7月31日,中国移动向科大讯飞出具《关于计划减持公司股份的告知函》,称计划于8月22日—12月31日以集中竞价或大宗交易的方式,减持科大讯飞不超过2315.67万股的...
日期:08-02
韩国漂流记:明星在面前,咖啡在手里,中国互联网公司在广告墙
声明:本文来自微信公众号“刺猬公社”(ID:ciweigongshe),作者:刺猬公社编辑部,授权转载发布。5月13日,一个普通的周六,一架从中国北京起飞的飞机在韩国首尔金浦机场落地,爱捞一走出...
日期:05-21
K30 Pro退役!米粉上车Redmi K60至尊版:2599元还送手环 这谁受得了
快科技8月15日消息,酷安一位米粉晒出了他的Redmi K60至尊版订单。这位米粉表示,K30 Pro可以休息了,K60至尊版2599元还送手环,这价格谁能受得了。作为K60系列终极大作,K60至尊版主...
日期:08-15
爱奇艺10月1日起增设会员拉新分账、取消平台定级_爱奇艺会员积分怎么兑换超前点播
  9月28日,爱奇艺宣布,10月1日起,爱奇艺剧集、动漫、儿童、纪录片领域将正式应用全新分账合作模式。新模式将在原会员观看时长分账基础上,增加会员拉新分账。同时,取消平台对内...
日期:09-30
锐龙7 7800X3D配A620主板 性能损失多少?实在没想到「锐龙r7 6800」
Intel近日接连推出两款特别的产品,一个是专为游戏玩家而生的锐龙7 7800X3D处理器,一个是献给入门级玩家的A620主板。它们都有着突出的性价比,能不能牵手呢?A620主板官方规范仅支...
日期:04-10
支付宝伪造「支付宝可识别仿冒小程序专利获授权」
3月15日 消息:企查查APP显示,近日,支付宝(杭州)信息技术有限公司申请的“一种仿冒小程序识别方法、装置、存储介质及电子设备”专利获授权。小米13ultra抖音称外卖服务仍在试点...
日期:03-15
数字化大会2020「“数据共生 智能未来”:2023全球数字大会在上海青浦正式启动」
作者:普子胥2023年11月6日,进博会主会场上海国家会展中心,由上海市青浦区人民政府指导、网易等公司主办的“数据共生 智能未来-2023全球数字大会”正式拉开了序幕。本次大会汇...
日期:11-07
雅虎新任CEO大猜想:Facebook COO成候选人(Facebook首席)
  在雅虎周二解雇CEO卡罗尔·巴茨(Carol Bartz)后,美国科技博客AllThingsD撰稿人卡拉·史威许(Kara Swisher)选出了16位可能成为雅虎新任CEO的科技界高管,Facebook、惠普和...
日期:07-22
网易严选启动星驰计划 1亿佣金池亿级流量扶持红人主播
  5月26日,网易严选发布“星驰计划”,计划面向抖音、快手、微博、淘宝等全网招募1000名优质红人主播、100家MCN机构,共创10个千万级爆品。   据了解,“星驰计划”为红人主...
日期:07-14
中国互联网上市两大“法宝”:用户+增长
  墙内开花墙外也香,海外资本市场的中国概念股也迎来了属于自己的“春天”。   今年一季度陆续爆发的中东和北非政局巨变以及接踵而来的日本地震增加了市场对于政治格局...
日期:07-27
大尾翼帅爆!比亚迪电动超跑仰望U9外形新图公布  网友:颜值提升100%
今年1月5日的仰望品牌发布会上,比亚迪正式发布百万级新能源越野车型仰望U8,同时还带来了百万级纯电性能超跑仰望U9。上海市送外卖多少钱一个月啊中国质量500强板材此前,仰望U8...
日期:04-08
耗子给猫当伴娘挣钱不要命「年轻人假期搞钱:喂猫一周赚5000、当伴娘一场500」
这个十一假期,你怎么过?大多数年轻人都趁着难得的机会去到处浪一浪”,但也有些人专心搞钱。iphone14最新官方消息多少钱前一段有杭州女孩给猫当保姆月薪6000元”的新闻,而在国庆...
日期:10-04
华为nove5i「华为nove5i多大尺寸」
近年来,华为在全球市场上的销售不断攀升,其“nova”系列手机在年轻消费者群体中也颇受欢迎。其中的华为nova5i在2019年6月正式推出,自上市以来备受关注。首先,华为nova5i拥有6.4...
日期:05-31
299元!华为Mate 60 Pro/Pro 微泵液冷手机壳上架:智能散热
快科技9月22日消息,从华为商城获悉,华为微泵液冷手机壳已正式上架,适配Mate 60 Pro、Mate 60 Pro 两款机型,售价299元。ID设计上,微泵液冷壳采用星弧形可视背面透窗设计,可看到内...
日期:09-23
被马化腾称为腾讯希望!视频号年度数据:雷军成最受欢迎知识主播
1月16日消息,今日,微信派”公众号发布视频号2022年度小结”,公布了包括视频播放量、直播观看量等视频号相关数据。据了解,2022年视频号泛知识短视频播放量增长109%,最受用户欢迎...
日期:01-16
田光辉:得线下渠道者得天下,得“产品+内容”才可走得远
通信世界网消息(CWW)2024年3月20日,由信通传媒·通信世界全媒体主办,工联网承办,中国通信企业协会虚拟运营分会协办的“2024移动转售产业生态发展大会”在四川省南充市举办。本次...
日期:03-26
印度街头奶茶「我在印度街边喝奶茶-干净又卫生 比尔·盖茨晒照」
快科技3月23日消息,比尔·盖茨再次在微博上分享了他最近一次难忘的印度之旅。“我又度过了一次美妙的印度之旅,这些是其中的亮点。 ”盖茨说道。其中一张图片中,盖茨正在印度的...
日期:03-23