您的位置:首页 > 互联网

开源软件以及gpl协议「OpenAI开源GPT-4 SAE,提供1600万个解释模式」

发布时间:2024-06-07 14:23:25  来源:互联网     背景:

声明:本文来自于微信公众号 AIGC开放社区(ID:AIGCOPEN),作者:AIGC开放社区,授权转载发布。

6月7日凌晨,OpenAI在官网开源了GPT-4的稀疏自动编码器(Sparse AutoEncoder,简称“SAE”)。

虽然现在大模型的功能越来越强,能生成文本、图片、视频、音频等内容,但是你无法控制神经网络生成的内容,例如,你问ChatGPT多个相同的问题,可能每一次回答的内容都不相同。

就像我们睡觉做梦一样,无论你怎么集中注意力还是很难精准控制脑神经形成的梦境。这就会出现很多无法控制的情况,例如,大模型生成的内容带有歧视性、错误、幻觉等。

SAE的主要作用是在训练过程中引入稀疏性约束,帮助大模型学习到数据的更有意义、更具解释性的特征表示,使其输出的内容更精准、安全。所以,SAE对于开发前沿、超强功能的大模型非常重要。

早在2023年10月,著名大模型平台Anthropic发布了一篇《朝向单义性:通过词典学习分解语言模型》的论文,深度解释了神经网络行为的方法。

下一代奥迪q5效果图

Anthropic在一个小型的Transformer架构模型进行了实验,将512个神经单元分解成4000多个特征,分别代表 DNA 序列、法律语言、HTTP 请求、营养说明等。

研究发现,单个特征的行为比神经元行为更容易解释、可控,同时每个特征在不同的AI模型中基本上都是通用的。

而本次OpenAI不仅公布了论文还开源了代码,同时提供了一个在线体验地址,与全球开发者分享他们的研究成果,同时让用户深度了解神经网络生成的内容流程,以便更精准、安全地控制大模型输出。

开源地址:https://github.com/openai/sparse_autoencoder

论文地址:https://cdn.openai.com/papers/sparse-autoencoders.pdf

在线demo:https://openaipublic.blob.core.windows.net/sparse-autoencoder/sae-viewer/index.html

什么控制神经网络行为很难

无论你用多么精准的提示词,都无法让DALL·E3、Stable Difusion生成100%相吻合的图片。这是因为,神经网络的输出很大程度上依赖于它们所接受的训练数据。

华为huawei matepad 11 2021款

神经网络通过大量的样本数据学习到复杂的模式和特征。但是,训练数据本身可能包含噪声、偏差或者数据标准不准确等。这些因素会直接影响神经网络对输入数据的响应。

例如,让神经网络生成一张猫的图片。如果训练数据中有一些不清晰或错误标记的图片,例如狗或其他动物的照片,模型可能会在生成猫的图片时出现混乱,生成出一些看起来不像猫的图像。同理,文本类的ChatGPT等产品也会出现一本正经胡说八道的情况。

gimp开源吗

神经网络的内部结构和参数设置极其复杂。随着技术的迭代,目前随便一个神经网络模型的参数都在几十亿甚至数百亿,这些参数共同决定了模型的行为。

在训练过程中,我们通过优化算法(如梯度下降法)对这些参数进行调整,但最终模型的表现是所有参数综合作用的结果,而非单一参数所能决定的。

这种复杂性导致我们难以精确预测或控制任何特定的输出。例如,如果你调整一个参数来让生成的图片更有细节,它可能导致其他部分的图片出现失真或不自然的效果。

此外,神经网络的设计和训练目标通常是为了优化整体性能指标(如准确率、损失函数等),而不是精确到每一个具体的输出细节。例如,在图像生成中,模型的目标可能是生成总体上看起来真实的图片,而不是控制每一个像素的具体值。

同样,在文本生成中,模型的目标是生成语法正确、语义连贯的句子,而不是控制每个单词的具体选择。例如,一个训练写诗的模型,目标是写出富有诗意的句子,而不是精确到每一个词的位置和使用频率。

这也就是说,大模型的输出通常是基于概率分布的采样,输出不可避免地带有一定程度的不确定性。

OpenAI的SAE简单介绍

SAE是一种无监督学习算法,属于自编码器家族的一种,主要用来学习输入数据的有效且稀疏的低维表示。在传统的自编码器中,数据被编码成一个潜在的低维表示,然后再解码回原始数据空间,目的是使重构的数据尽可能接近原始输入。

而SAE在此基础上添加了一个关键特性,即对隐藏层的激活进行稀疏性约束,这意味着在隐藏层中只有少量的神经元会被激活(通常接近0),而大部分神经元则保持在非常低的激活水平或者完全不激活。

从OpenAI公布的论文来看,为了深度理解大模型的单个神经元行为,OpenAI使用了一种N2G的方法。

华为麒麟芯片970

N2G的核心思想是,如果一个潜在单元在给定的输入模式下被激活,那么这个单元可能对输入中的某些特定特征或模式特别敏感。

通过识别这些特征或模式,我们可以为每个潜在单元构建一个图表示,图中的节点对应于输入序列中的特定位置,而边则表示这些位置之间的依赖关系。这种图表示可以揭示潜在单元激活的条件,从而提供对模型行为的直观理解。

gcode 开源

N2G的构建过程开始于选择一些能够激活特定潜在单元的序列。对于每个序列,N2G寻找最短的后缀,这个后缀仍然能够激活该潜在单元。这个过程是为了确定潜在单元激活的最小必要条件。

接着,N2G会检查内容是否可以被填充标记替换,以插入通配符,从而允许在解释中包含变化的部分。此外,N2G还会检查解释是否依赖于绝对位置,即在序列的开始处插入填充标记是否会影响潜在单元的激活。

小米10 esim

N2G还有一个非常大的技术优势就是对算力需求很低,与需要模拟整个模型行为的解释方法相比,N2G只需要分析潜在单元的激活模式即可。

目前,OpenAI通过SAE在GPT-4模型中找到了1600万个可解释的模式和特征,但这还远远不够。如果想通过SAE完整捕捉大模型的行为,大概需要10亿或数万亿个特征才可以。


返回网站首页

本文评论
榜上有名,中兴通讯5G再度入选《财富》中国ESG影响力榜
近段时间,由《财富》制榜的“ 2023 年中国ESG影响力榜单”正式对外公布,中兴通讯5G凭借自身在绿色发展、社会责任、公司治理方面的坚持与努力荣登榜单,这是中兴通讯5G继 2022...
日期:05-26
天星数科原首席风控官季春江出任小米消费金融总裁
记者/王蕙蓉   自开业两年多,小米消金迎来第二任总裁季春江。   8月9日,银保监会官网显示,重庆银保监局核准季春江(JI,CHUNJIANG MICHAEL)的重庆小米消费金融有限公司(下称...
日期:08-10
苹果icloud打开邮件出现问题「苹果服务器再出故障 iCloud邮件一度加载缓慢或服务中断」
4月6日 消息:苹果的天气服务前不久出现了一些问题,主要表现为无数据刷新和小组件不显示数据等。然而,苹果服务器最近又出现了问题,导致iCloud和iMessage崩溃,用户遇到了加载缓慢...
日期:04-06
Contra Pro:专为独立开发者和设计师服务的AI作品集建站平台「contraptio」
9月15日 消息:Contra Pro是一款面向自由职业者的专业在线作品集平台。该平台提供了众多功能,能够全面满足自由职业者的业务需求。Contra Pro具有强大的分析功能,能够实时追踪...
日期:09-15
一场社区文化节211万销额! 三翼鸟持续变现
现如今,对于品牌而言,谁离用户更近,谁就能精准洞察用户需求,通过对需求的快速转化,进而成为用户之选。为了离用户更近, 9 月份,三翼鸟举办首届社区文化节直接将场景样板间搬进了小...
日期:10-31
春节电视买哪款好?这5款高品质电视千万别错过! 值得收藏!_2021年买哪种电视机好
  春节临近,年货必须置办起来,在新春期间选购一台全家人满意的大屏电视,成为春节家庭欢聚的好伴侣。无论是观看除夕夜的龙年春晚联欢晚会,还是陪伴亲朋好友春节在家追剧享受家...
日期:01-30
魔搭科技公司「魔搭社区上线Mistral AI 首个开源 MoE 模型 Mixtral8x7B」
12月14日 消息:Mistral AI 近日发布了首个开源 MoE 模型 Mixtral8x7B,并宣布在魔搭社区上线。天猫精灵新品发布会Mixtral-8x7B 是一款混合专家模型(Mixtrue of Experts),由8个拥...
日期:12-14
马斯克融资历史「部分投资者也是OpenAI股东 马斯克称xAI,60亿美元融资是新增资金」
5月28日消息,埃隆·马斯克(Elon Musk)的人工智能初创公司xAI宣布,该公司已成功筹集到60亿美元资金,这是迄今为止规模最大的一轮风险投资融资之一。这笔资金将助力马斯克在人工智...
日期:05-28
女生期待薪资7千到1万被HR怒怼:你值这个价吗?_hr给的工资比期望工资高
面试时,一般面试官都会问求职者的期待薪资。为了提高自己的薪资,求职者一般会提高自己的期望薪资。然而没想到,江苏苏州一女生却因为将期待薪资填7千到1万,求职被HR怼用不起。re...
日期:01-30
春节档最大赢家!电影《满江红》票房突破45亿_满江红 电影 2014
3月4日消息,灯塔专业版数据显示,电影《满江红》上映42天,实时票房破45亿,累计观影人次达到了9072万,是春节档最大的赢家。网易智造无线充电器 评测这部电影以金国使者被杀、所携...
日期:03-05
腾讯截至6月底共110715名员工,平均月薪85473元_腾讯宣布向3300名员工发11亿,平均每人到手34万
讯 8月17日下午消息,腾讯控股今日发布2022年度第二季度财报。财报显示,该公司第二季度营收1340亿元,同比下滑3%;净利润186亿元,同比下滑56%,非国际财务报告准则下,净利润281亿元,同...
日期:08-19
Meta人工智能科学家抨击业内大佬夸大威胁炒作监管_mat首提人工智能
10月31日 消息:Meta首席人工智能科学家Yann LeCun近日在社交平台上发帖,指责OpenAI、谷歌DeepMind、Anthropic等公司的CEO夸大人工智能对人类的威胁,以此来争取对行业的监管。...
日期:11-01
麦肯锡:银行业每年有望从生成式AI获得2000亿至3400亿美元利润_麦肯锡 银行数字化转型
**划重点:**OpenHarmony产业生态研讨会1. 北京智博领航教育科技有限公司官网小米5 flyme...
日期:12-06
《流浪地球3》定档 李雪健吴京回归  宇宙之路危机四伏_流浪地球吴京角色
电影《流浪地球3》正式宣布定档于 2027 年大年初一,这一消息是通过电影《流浪地球》官方微博在 2023 年 11 月 3 日发布的。虽然电影尚未开始拍摄,但导演郭帆在发布会上表示他...
日期:11-04
珍惜免费升级Win11机会!微软宣布放弃Windows 10时间:还有2年
快科技10月16日消息,对于微软来说,不升级Windows 11的用户,就是最大的阻碍,如果你还坚守Windows 10,那么不好意思了。iphone13渐变色Windows 10 支持将于2025年10月14日结束,用户...
日期:10-16
iPhone折叠屏渲染图出炉!隐藏式刘海成了_iphone怎么把刘海屏变成全面屏
中关村在线消息:11月4日,据相关爆料,iPhone或将在2024年推出首款折叠屏产品,该设备或采用与三星Galaxy Z Filp相同的竖着方案,可以看出机身正面没任何挖孔,采用了全新设计的隐藏式...
日期:11-09
拒绝董明珠3次的主播郑茹心评孟羽童离职:去读书是很好的选择
曾有着小董明珠”、甚至一度被当作接班人”培养的孟羽童,已经离开格力。尽管关于其是否系被开除还众说纷纭,但似乎已经没人再去关心。日前,在与教育网红张雪峰等进行网络连线时...
日期:05-28
Epic喜加一!B社《辐射3》年度最佳游戏版免费送:仅限今天_辐射3下载
快科技12月24日消息,每年年底Epic商城都会开启一波送游戏的大潮,目前Epic假日特卖正在进行中,这期间将连续16天送出1款免费游戏,活动期间每天都是喜加一”。iphone手机掉了能让...
日期:12-24
国产三蹦子在美国订单猛增 已遍及70个国家和地区:外国人给国货点赞
快科技1月22日消息,据国内媒体报道称,国产三蹦子在国外街头火了”的话题引发热议,不少外国人纷纷给它点赞。现在的情况是,国产三蹦子已遍及70个国家和地区,特别是在美国订单激增...
日期:01-22