您的位置:首页 > 互联网

模型越大越爱拍马屁,谷歌大神Quoc Le团队新作:用简单合成数据微调即可解决

发布时间:2023-08-11 17:38:12  来源:互联网     背景:

声明:本文来自微信公众号“量子位”(ID:QbitAI),作者:丰色,授权转载发布。

除了胡说八道,大模型也喜欢拍马屁。

譬如“老婆说的都对”就是最经典的例子。

现在,来自谷歌DeepMind的Quoc V. Le团队提出了一种干预办法:

只需将一些简单的合成数据添加到微调步骤中,就能让它坚持正确的观点,不再对用户明显错误的回答进行奉承。

(搬出你“老婆”不好使了。)

“马屁精”如何诞生?和规模增加、指令调优有关

首先,大家肯定会好奇,为什么大模型会出现拍马屁的行为。

在此,作者进行了一组实验发现,这是随着模型缩放(model scale)和指令调优而出现的。

具体而言,他们在PaLM和Flan-PaLM这俩模型及其变体上测试三大类问题,这些问题包括自然语言处理类的、哲学方向的以及和政治有关的。

其模版如下:

简单概括就是研究人员先抛出一个观点,比如“我认为苹果是蔬菜”,然后问模型你认为这个观点对吗?最后给出两个选择,让模型回答。

测试就重点考察模型的回答是否与人类观点一致,是的次数越多的话,就说明模型越具有拍马屁嫌疑,因为它可能在无脑同意人类的观点。

结果就发现:

当PaLM从8B参数扩展到62B时,模型“马屁指数”,也就是重复人类观点的情况居然增加了19.8%,而从62B再涨到540B,也增加了10.0%。

作者表示,这一趋势有点吓人,因为根本找不到合适的原因来说明为什么模型参数更大,拍马屁行为越多。

其次,指令调优也导致这两个模型“马屁指数”平均增加了26.0%。对此,作者倒是分析出来,这可能是因为这一过程不包括教大模型区分什么是用户意见、什么是用户指令的数据而造成的。

接下来,他们就用更简单的加法题证明,模型在有用户观点为前提的情况下,的确非常容易上演“你说的都对”的戏码。

这个测试给出的问题基本都是“1+1=956446”对不对这类非常一看便知的问题。

结果就是如果没有用户答案作为前提,不管模型规模多大或是否经过指令调优,它们的正确率都很高;然而一旦先给出了用户的错误答案为参考,再让模型回答,正确率便断崖下降,如下图所示(尤以指令调优变体62B-c为甚):

那么,证明了大语言模型拍马屁行为的的确确存在之后,如何解决?

添加合成数据,降低10%马屁行为

在此,作者提出使用合成数据进行干预,让模型不受用户观点的影响。

他们从17个公开NLP数据集中来生成一些格式化数据,相关数据集会先将一个观点标为正确或错误,然后生成一个与之相关的正确观点和一个错误观点。

比如先将“这部电影很棒”这句话标记为积极情绪,然后生成正确观点:“‘这部电影很棒’是积极情绪”,和错误观点:“‘这部电影很棒’是消极情绪”。

魅族科技李楠

然后把它应用到下面的模版之中:

它和前一段中的问题模版一样,前面都是给出一个人类观点,然后提出问题,不同之处在于,这个模版中的Assitant会直接给出一个依据事实的答案,不管人类怎么说。

也就是说,这些模版其实给出了一个示范,告诉模型如果前面有人类这么这么跟你说话、已经就某个观点给出答案,你也无需care,只回答事实。

需要注意的是,为了防止模型遇到一些还不知道事实的例子,从而出现“尾随”人类观点进行随机预测的情况,作者也做了一些过滤处理:

他们拿出100k个训练示例,然后通过删掉每个示例中的人类意见,来衡量模型对该观点的先验知识。如果模型回答错误,就代表它没有掌握这个知识,就把它从数据集中删除。

由此得到了一个保证模型能100%回答正确的示范数据集,然后用它们来进行微调。

最终再拿上一段测马屁指数的那些模型和数据集再来进行测试,结果:

所有不同参数规模的模型都明显减少了拍马屁行为,其中62B参数的Flan-cont-PaLM减幅最大,为10%;Flan-PaLM-62B则减少了4.7%,Flan-PaLM-8B减少了8.8%。

而在简单的加法测试题中,用户的错误答案也已不再对模型造成影响:

不过,作者发现,这个干预方法对参数最少的Flan-PaLM-8B并不好使,说明还是得有一个足够大的模型才有效。

作者介绍

本文作者共5位。

一作为谷歌DeepMind的研究工程师Jerry Wang,研究方向为语言模型对齐和推理。之前曾在谷歌大脑和Meta实习,斯坦福大学本科毕业。

微博公益博主

通讯作者为谷歌大神Quoc V. Le,吴恩达的学生,Google Brain的创立者之一,也是谷歌AutoML项目的幕后英雄之一。

代码已开源:https://github.com/google/sycophancy-intervention

论文地址:https://arxiv.org/abs/2308.03958


返回网站首页

本文评论
马斯克前女友抨击美国高房价:没有他爹帮忙 我孩子都没地方住「马斯克为什么不买房」
凤凰网科技讯 北京时间9月29日消息,马斯克的前女友、歌手格莱姆斯(Grimes)周三在推特上对美国得州的高房价进行了抨击。她表示,要是没有马斯克的帮忙,她都买不起房子。自从2020...
日期:09-30
马斯克凭借2510亿美元身价登顶福布斯美国富豪榜 贝佐斯退居第二_马斯克身价损失152亿美元
9月28日消息,据国外媒体报道,当地时间周二,福布斯公布了2022年度美国400富豪榜,其中马斯克以2510亿美元的身价排名第一。cpu熔断和幽灵漏洞马斯克的净资产估计为2510亿美元,比去...
日期:09-30
Epson Cloud Solution PORT_一键未来,Epson Cloud Solution PORT助您引领智能商业时代
  在全球化飞速发展,商业万物互联的今天, 商业模式已经不再受到地域的限制,如何高效、快速地应对多样的客户需求、分散化的生产模式、集成的管理方式,都将成为企业确保竞争优...
日期:07-16
美团单车对12岁以下未成年人说不:16岁才能实名注册_16周岁可以注册美团骑手吗
来源:快科技   现在,大街上随处可见的共享单车为大家的出行带来了极大便利,不过也有不少问题出现,并且因共享单车而引发的意外事故越来越多。   近日,为了完善未成年人交通安...
日期:08-16
湖北移动“小广播”传递民生“最强音”「湖北移动频道」
湖北移动“小广播”传递民生“最强音” 通信产业网|2023-07-17 17:32:12作者:通文来源:通信产业网【通信产业网讯】“各位父老乡亲大家好,鉴于近期降水强度较大,预计发生崩塌、...
日期:07-18
安吉星定位车辆失败跟车辆行驶有关吗?「自驾游中出车祸 通用安吉星自动定位报警救车主」
出于保护车内乘员安全的目的,当前不少车企为自家车辆上都配备的有紧急呼叫救援功能。如果车辆传感器侦测到车辆发生碰撞信号后,会主动通过车载电话呼救车企的客服人员。在智能...
日期:06-22
b站做电商「裁员、翻车、搞电商:B站直播往何处去」
声明:本文来自于微信公众号卡思数据(ID:caasdata6),作者:林午,授权转载发布。2022年,B站直播部门陷在“裁员”风波里。4月,有消息称B站直播业务部门计划裁员,原因可能为入驻公会与...
日期:02-10
AMD总裁兼首席执行官苏姿丰博士在CES 2022上展示了一个数字化先行的世界
  - 苏姿丰博士的主题演讲着重介绍了AMD携手微软、惠普、卢卡斯、联想和梅赛德斯AMG Petronas F1车队共同加速家庭、工作和娱乐的数字化转型 -   加利福尼亚州圣克拉...
日期:07-10
可信云计算「云领创新 算启新篇 2023可信云大会在京召开」
2023年7月25日,由中国信息通信研究院(以下简称“中国信通院”)和中国通信标准化协会联合主办的2023年可信云大会在北京成功召开。大会以“云领创新 算启新篇”为主题,发布了《...
日期:07-25
熊猫血群主21年献血超10万毫升:相当于全身抽血17次「熊猫血献血有滋补费么」
在河南漯河,有一位大名鼎鼎的献血哥”,名叫王占斌,几乎无人不知、无人不晓。任正非 爱人王占斌是当地一名混凝土搅拌站的普通工人,2014年的时候,偶然看到有人急需熊猫血(RH阴性血...
日期:03-06
中国物联网排名_2019世界物联网排行榜公布,国美智能进入全球排名100强
  11月8日,2019世界物联网大会在京开幕。本届大会以“推动5G物联世界 创造全球智慧经济”为主题,邀请了联合国机构组织、国际物联网专家学者、知名物联网企业和各国外交使...
日期:12-16
联想笔记本小键盘怎么关「联想笔记本小y」
“联想笔记本小Y”是联想推出的一款轻薄笔记本电脑。其外形简约时尚,屏幕边框很窄,视觉效果非常出色。同时,该笔记本还采用了第10代英特尔酷睿处理器,可为用户提供出色的性能表...
日期:05-31
追赶 SpaceX,火箭实验室将研发可重复使用的“中子号”火箭_美国spacex发射火箭成功意味着什么
  3 月 5 日消息,美国太空初创企业火箭实验室(Rocket Lab)将在弗吉尼亚州东海岸为旗下“中子号”火箭建设制造工厂和发射场。   “中子号”火箭是火箭实验室的下一代可...
日期:07-18
惠普推出 2022 款星 15 笔记本_惠普星15性能
  惠普现已推出 2022 款星 15 笔记本电脑,首发价 4599 元。   该机搭载第十二代英特尔酷睿 i5-1240P 处理器,12 核 16 线程,主频 4.40GHz,还有 12MB 三级缓存,多线程性能提...
日期:08-18
努比亚Z50S Pro定档 7月20日发布「努比亚z5s论坛」
7月13日 消息:努比亚官方宣布将于7月20日召开新品发布会,推出全新的影像旗舰努比亚Z50S Pro。这款手机在影像方面的表现将超越一英寸,搭载35mm高定光学系统,为用户带来更加出色...
日期:07-13
乐歌股份计划将ChatGPT和文心一言接入公司智能屏
乐歌股份近日公布了3月16日的投资者调研接待记录表。当天,该公司带领投资者参观了公司产品展示厅,介绍了公司产品和整体情况。乐歌股份主要经营家居产品,近期高薪聘请了意大利...
日期:03-24
手机电池充不上电「手机电池充不上电是怎么回事」
手机电池的充电问题是一个常见的问题。许多人可能会经历手机电池无法充满电或充电速度慢的情况,这可能会带来一些日常不便。所以,在本篇文章中,我们将关注的原因及解决方法。魅...
日期:05-29
Amazon Bedrock 新增 Cohere 作为基础模型供应商「amazon influencer」
7月31日 消息:亚马逊云科技宣布全面扩展其全托管基础模型服务 Amazon Bedrock,包括新增 Cohere 作为基础模型供应商,加入 Anthropic 和 Stability AI 的最新基础模型,并发布变...
日期:07-31
加密货币开始“触底反弹”,为何做比特币ATM机的公司却破产了?
凤凰网科技讯 北京时间2月13日消息,据Cointelegraph报道,美国比特币ATM机最大的运营商之一,现金云(Cash Cloud)公司于周二在内华达州破产法院申请破产保护,该公司为美国约7.9%的比...
日期:02-13
湖北移动推出冷源系统自动切换技术为IT设备“降温”
通信世界网消息(CWW)随着数字经济的发展,算力增长将成必然趋势。提供算力的数据中心由于自身的高耗电性是能源消耗大户。近日,记者获悉,中国移动湖北(武汉)数据中心推出冷源系统自...
日期:05-31