您的位置:首页 > 互联网

语言模型plug「OpenAI开发新工具,试图解释大语言模型的行为」

发布时间:2023-05-10 13:51:07  来源:互联网     背景:

5月10日 消息:在很多人看来,与OpenAI 的 ChatGPT类似的大型语言模型 (LLM)就像一个黑匣子,因为即使对于数据科学家来说,也很难知道为什么这些模型总是以自己的方式做出反应,就像凭空捏造事实一样。

为了能够剖析 LLM 的的行为,OpenAI 正在开发一种工具来自动识别 LLM 的哪些部分对其行为负责。简单的说,OpenAI在最新的发布成果中,展示了用 GPT-4解释 GPT-2的行为,获得了初步的成果。

OpenAI开发的工具通过调用 GPT-4来计算出其他架构更简单的语言模型上神经元的行为。该工具会为 LLM 中的每个神经元生成解释,这些解释被编译到与工具代码一起发布的数据集中。

语言模型plug

大模型(LLM)和人脑一样,由「神经元」组成,这些神经元会观察文本中的特定规律,进而影响到模型本身生产的文本。

比如有一个针对「漫威超级英雄」的神经元,当用户向模型提问「哪个超级英雄的能力最强」时,这个神经元就会提高模型在回答中说出漫威英雄的概率。开始之前,先让 GPT-2运行文本序列,等待某个特定神经元被频繁「激活」的情况。

三星持有京东方股份

OpenAI 开发的工具利用这种规则将模型进行分解。

首先,让 GPT-4针对这段文本,生成解释。比如在下面的案例中,神经元主要针对漫威内容。GPT-4接收到文本和激活情况后,判断这与电影、角色和娱乐有关。接着,用 GPT-4模拟这个 GPT-2的神经元接下来会做什么,并用GPT-4生成的模拟内容。最后,进行对比评估。对比4代模拟神经元和2代真实神经元的结果,看 GPT-4猜的有多准。为了确定解释的准确性,该工具为 GPT-4提供了文本序列,并让它预测或模拟神经元的行为方式。然后将模拟神经元的行为与实际神经元的行为进行比较。

语言模型plug

通过这样的方法,OpenAI 对每个神经元的行为作出了初步的自然语言解释,并对这种解释和实际行为的匹配程度进行了评分。

研究人员已经对 GPT-2中的所有307,200个神经元生成解释,并将这些解释汇编成数据集,与工具代码一起在 GitHub 上发布。

语言模型plug

它背后的工程师强调它还处于早期阶段,但其运行代码已经可以在 GitHub 上以开源方式获得。OpenAI 的工具可以帮助研究人员更好地理解 LLM 的行为,从而提高性能并减少偏差或毒性。

也有人质疑,该工具本质上是为 GPT-4做广告,因为它需要 GPT-4才能工作。其他解释 LLM 工具较少依赖商业 API,例如 DeepMind 的Tracr。


返回网站首页

本文评论
马斯克展示脑机接口新进展「马斯克旗下脑机接口公司Neuralink正寻找人体试验合作伙伴」
3月28日消息,据外媒报道,埃隆·马斯克旗下脑机接口公司Neuralink正在寻找人体试验合作伙伴。六名知情人士透露,Neuralink已与美国最大的神经外科中心之一接触,洽谈潜在的合作事...
日期:03-28
人民日报发起“筑梦青春”云校招活动 Soul助力大学生就业
  一年一度的校招季又来了,为助力2020年高校应届毕业生就业冲刺,人民日报新媒体发起,联合教育部高校学生司、全国高等学校学生信息咨询与就业指导中心,共同搭建大学生就业云...
日期:07-14
小米13 Ultra采用可变光圈技术、后置徕卡四摄
4月10日消息,小米13 Ultra将于本月正式发布,目前外观已经曝光的差不多了,跟上一代的差别很小。但对于后摄的具体配置,现在又有了新的消息,据数码博主爆料称,小米13 Ultra也将采用...
日期:04-11
魅族新专利可让丢失手机实现黑屏锁卡槽
12月13日 消息:企查查APP显示,近日,珠海市魅族科技有限公司“电子设备防盗方法、装置及系统、电子设备及存储介质”专利获授权。amd支持ddr5内存的cpu上市企查查专利摘要显示,...
日期:12-13
充一次最高花40元 共享充电宝怎么成了“价格刺客”?「共享充电宝购买以后充电怎么收费」
近日,共享充电宝涨价的话题冲上热搜。北京青年报记者看到,目前多数充电宝价格在每小时3-4元,最高的达一小时10元。消费者表示,租借前并不能看到价格,希望厂商可以增加价格透明度...
日期:09-09
电商助农直播带货「宣称“助农” 直播带货贵卖农产品谁最受益?」
  来源:工人日报  近段时间,主播辛巴在直播间质疑东方甄选售卖6元一根的玉米存在暴利等问题,引起关注。有人认为,“谷贱伤农”但“谷贵”也未必能“富农”。对此,有评论指出,...
日期:10-04
阿里巴巴达摩院正研发“阿里版”ChatGPT:目前内测中_阿里巴巴公司达摩院
最近ChatGPT一夜爆火,成了全球最受关注的AI产品,而且在实际表现上远超以往的任何产品。值得一提的是,我国不少公司也都早早就在布局类似领域,国产版ChatGPT可能很快就会亮相。根...
日期:02-09
iPhone 15 Pro外观设计曝光,去掉所有物理按键
中关村在线消息:iPhone一直是数码届的顶流,虽然iPhone15在9月份发布,但是iPhone15已经有了非常多的爆料。笔者为大家汇总了一些比较靠谱的爆料信息,看看未来的iPhone15是否依旧...
日期:01-22
马克·扎克伯格公布今年“个人年度挑战”:亲自动手屠宰猪羊
  马克·扎克伯格,许多人都知道他是一名IT精英和亿万富翁,但是你能想象这位Facebook创始人“磨刀霍霍向猪羊”的情景么?据英国《每日邮报》5月27日报道,马克·扎克伯格刚刚公...
日期:07-28
渝昆高铁全线首座转体桥成功转体:通车后成都至昆明只要3小时
10月30日,据央视新闻消息,今日上午,四川泸州的重庆至昆明高速铁路寒坡岭特大桥建设现场,一条巨型T梁空中转体对接,成功跨越既有隆黄铁路,标志着渝昆高铁全线首座转体连续梁成功转...
日期:10-31
AMD面临艰难新季度,与英特尔英伟达的竞争不断加剧_英伟达、英特尔、AMD等芯片巨头集体萎靡,PC销售热潮已退
realme gt neo2屏幕素质你以为诺基亚死了,它却一跃成为全球5G巨头   过去近两年,当疫情期间人们被隔离在家时,PC出货量出现爆发式增长。而现在,这样的增长终于消失。   当...
日期:08-16
影吧是怎么收费的_影著协回应网吧收费质疑 称今年一定会开始收
  成立于4月16日的中国电影著作权协会(以下简称影著协)可能不会料到,仅仅诞生半个月,自己就处于舆论的风口浪尖。导火索是影著协要向网吧收取电影版权费:约每天每台电脑终端...
日期:07-29
微信视频号将发布付费订阅功能 提供包括评论区广告分成等功能_微信视频号订阅号
  讯 3月28日晚间消息,今日,2023微信公开课PRO·微信之约直播开讲。会上视频号公布了包括付费订阅功能与“原创权益”扶持等多项产品计划,未来将支持创作者设立付费内容专区,...
日期:03-29
搭载麒麟710A!华为nova 8 SE官方二手机上架:999元_华为nova 8 se手机价格
快科技5月8日消息,华为商城官网今天上架了一款官方认证的二手nova 8 SE,9新成色,8GB 128GB售价999元。大数据 峰会这是一款华为在2021年发布的中低端机型,但采用了如今比较流行...
日期:05-09
抖音官方项目合作「达达快送与抖音生活服务达成战略合作」
12月5日消息,达达快送与抖音生活服务宣布正式达成战略合作。据悉,作为与抖音生活服务合作的首批即时运力服务商,达达快送将为抖音生活服务平台上的餐饮商家提供同城配送解决方...
日期:12-06
每周AI大事件 | 微软全面开放BingChat、AI引发大裁员、OpenAI已不使用客户数据
欢迎来到的[每周AI大事件],这里记录了过去一周值得关注的AI领域相关内容,帮助大家更好地了解人工智能领域的动态和发展风向。Part1动态[国内要闻]科大讯飞发布“星火”认知大...
日期:05-07
华硕新款灵耀 X 14 上架,触控板副屏设计,首发 8799元「华硕灵耀14可以触屏吗」
IT之家 9 月 14 日消息,华硕新款灵耀X 14 现已上架官方商城,采用了 14 英寸 2.8KOLED屏,还拥有触控板副屏设计,首发价 8799 元。IT之家了解到,该机搭载了英特尔 12 代酷睿 i7-126...
日期:09-27
嘴吃菠萝坏了怎么办「女孩拿菠萝当午饭啃食后烂嘴:3小时后嘴角全烂」
3月4日消息,河北张家口一女孩发帖称自己吃完菠萝后开始烂嘴。当事人曹同学表示,没有切菠萝的工具,自己也没有吃午饭,就把菠萝当午饭啃着吃完了,3个小时后嘴角烂了,到医院涂了凡士...
日期:03-05
哈罗单车欠费有事吗_哈啰单车崩了?官方回应:已修复,受影响用户补偿1天骑行卡
讯 8月15日上午消息,今日早间,有许多网友在社交平台反馈称,哈啰单车崩了,手机无法扫码解锁车辆,由于正好是周一早高峰,不少用户出行受到影响。对此,哈啰在其官方微博回应表示,由于第...
日期:08-16
360IoT助力“明厨亮社”工程 智能硬件加速食品安全建设
  6月19日,由国务院食品安全办指导、中国质量报刊社主办的食品产业健康发展大数据交流会在北京举行。360 IoT总裁李文智受邀出席活动,并在食品安全“大数据可视化融平台...
日期:03-08