您的位置:首页 > 互联网

OpenAI发布新安全框架,董事会有权否决CEO发布新模型_openresty 安全

发布时间:2023-12-20 03:00:37  来源:互联网     背景:

机器之能报道

编辑:吴昕

人类正在进入生成式 AI 新时代。而 OpenAI 在引导新技术朝着符合人类价值观和安全标准的方向所做的努力,也被视为行业的路标。

还记得 Sam Altman 回归 OpenAI 时提到的三个当务之急吗?

首当其冲的就是险些将他踢出公司的安全问题。现在,OpenAI 正力图系统化他们的安全思维。

我们的准备团队正在开展开创性工作,将安全发展成为一门定量科学。 OpenAI 总裁 Greg Brockman 在社交平台上表示。

百度的来源出处解释

本周一,公司在其网站上公布的一项计划,制定了一个框架来解决其最先进模型的安全性问题。

公司表示,只有在网络安全和核威胁等特定领域被认为安全的情况下才会部署其最新技术。

另外,他们还成立了一个咨询小组,负责审查安全报告,并将其发送给公司的高管和董事会。虽然高管会有权决策,但董事会可以推翻这些决定。

自一年前 ChatGPT 推出以来,AI 的潜在危险一直是 AI 研究人员和公众的头等大事。生成式 AI 让用户眼花缭乱的同时,也因其传播虚假信息等问题而引发安全担忧。

今年 4 月,一群行业领袖和专家签署了一封公开信,呼吁暂停开发比 OpenAI 的 GPT-4 更强大的系统六个月,理由是对社会的潜在风险。路透社/益普索(Ipsos) 5 月的一项民意调查发现,超过三分之二的美国人担心 AI 可能产生的负面影响,61% 的人认为它可能威胁到文明。

5 月,包括 CEO Sam Altman、首席科学家 Ilya Sutskever 和 CTO Mira Murati 在内的 OpenAI 领导层与其他 AI 专家签署了一封信,优先考虑解决先进 AI 模型的风险。

7 月,OpenAI 成立 Superalignment 团队,为 超级智能模型提供理论指南。

9月,OpenAI 宣布推出红队网络(Red Teaming Network),并邀请各领域专家加入,以提高其模型的安全性。

一个月前,OpenAI 对外称计划成立一个叫 Prepareness 的团队,监督前沿技术的灾难性风险。该团队将由 MIT 可部署机器学习中心主任 Aleksander Madry 领导。

本周一,OpenAI 正式宣布 Preparedness 成立,并介绍了 Prepareness 团队的工作流程——第一代准备框架,旨在为识别、分析和如何处理正在开发的模型固有的『灾难性』风险提供一条清晰的路径。

所谓灾难性风险,是指任何可能导致数千亿美元经济损失或导致许多人严重伤害或死亡的风险——这包括但不限于生存风险。

根据框架设计,针对开发中的前沿模型,将由准备( Prepareness )团队负责模型发布之前识别和量化风险。

准备团队也将与现有的安全系统团队、超级对齐团队以及其他安全政策团队密切合作。

其中,安全系统团队负责现有模型的安全问题。比如,针对 ChatGPT 的系统性滥用,可以通过 API 限制或调整来缓解。

超级对齐团队正在研究超级智能模型的理论指南。

在此之前,这三个部门的职能都统一在信任和安全部。不过,后者的主管 Dave Willner 已经于今年 7 月辞职。

增程式和混动式汽车是一回事吗

针对既有的、更前沿的和(更远的)超级智能模型,分别有三个团队负责其安全风险的识别和报告。

具体的评估方法将采用记分卡制度。准备团队会评估并不断更新模型的记分卡,出具详细报告。

记分卡的样子

我们可以看到记分卡上,抽象的灾难性风险被进一步量化为四个类别的风险:

网络安全、说服力(例如,虚假信息)、模型自主性和 CBRN(化学、生物、放射性和核威胁,比如,创造新的病原体)。

针对每一类风险,记分卡设定了四个风险级别(低、中、高和关键),并记录采取应对措施前后的风险得分。

采取应对措施后( post-mitigation )得分为中或更低的模型才有资格部署。例如,会对制造毒品或炸弹的过程保持沉默。

采取应对措施后,如果模型仍被评估为高风险,将不能得到部署,但还能进一步研发。

如果模型存在任何严重(关键)风险,公司不会进一步开发该模型。

采取应对措施前,风险为严重(关键)的模型,会被量身定制额外的安全措施。

为了探求极限情况下的风险边界,评估所有前沿模型时会包括在训练运行期间每增加 2 倍的有效计算量。

采取应对措施后得分为前两者的模型,才有部署的资格。

在日常运营方面,准备小组负责技术工作,包括检查前沿模型能力的局限性、评估并撰写报告。

考虑到制作这些模型的人不一定是评估模型和提出建议的最佳人选,OpenAI 正在组建一个跨职能的安全咨询小组( SAG ,设有主席一职)。该小组将从技术层面审查研究人员的报告,并从更高的角度提出建议(比如,建议减轻风险的应对方法)。

OpenAI 希望这一设置有助于发现一些未知的未知(尽管从本质上来说,这些是相当难以捕捉的。) SAG 成员(包括负责人)将由 OpenAI 领导层任命。

根据 Altman 回归公司时发布的公开信,我会和 Mira 一起做这件事(指安全问题——编辑注), 我们推测这里的领导层应该是指 CEO Sam Altman 和 CTO Mira Murati 。

同时,该安全咨询小组也会将这些(审查和建议)发送给领导层和董事会。虽然领导层是决策者,但董事会拥有推翻决策的权利。

openresty 安全

不过,外界也不是没有疑问。

假如 OpenAI 真开发了一个模型且具有关键风险, 过去那个非盈利组织 OpenAI 并不羞于对此类事情大肆宣扬——谈论他们的模型有多么强大,以至于他们拒绝发布它们,但今非昔比。

姑且不论由管理层任命的安全咨询成员在关键时刻有多大概率站在所谓的对立面,如果真有专家小组提出建议(就像之前直言不讳、然后被罢免的独立董事那样),而 CEO 依然决定部署模型,新的董事果真敢于推翻领导层的决定、踩下刹车吗?

就算他们这样做了,外界会听到真实的声音吗?除非 OpenAI 将征求独立第三方审计,否则,外界很难认为 OpenAI 真正解决了透明度和安全问题。

参考链接

最小内存的吃鸡

https://cdn.openai.com/openai-preparedness-framework-beta.pdf

民航客机飞行员

https://openai.com/safety/preparedness

© THE END

转载请联系本公众号获得授权

投稿或寻求报道:content@jiqizhixin.com


返回网站首页

本文评论
卢伟冰和联发科关系「火药味升级!卢伟冰连击打脸友商,一加Ace3提档怼Redmi K70」
  科客点评:去年K60系列可以说是在前期被打得鼻青脸肿,这回依然是率先发布,感觉一加还是会在定价等部分进行更多的针对。马斯克推特怎么看  11月29日,Redmi举行了K70系列的...
日期:12-01
200亿美元“卖身”巨头,Figma不是SaaS的“终极出路”_figma的优势
  屠龙少年未必一定变成恶龙,也可能是恶龙的“新救赎”。  作者 | 罗宁; 编辑;|;靖宇  来源:极客公园  9 月 15 日,成立十年零一个月的设计平台 Figma,被成立四十年的软...
日期:10-01
发黑床单、盗版影片、摄像头偷窥无遮拦:这样的私人影院难持久
只需一套投影设备、一组氛围灯、一张床,消费者就能享受自在的观影乐趣。如今,凭借可提供更为私密、更多选择的观影体验的优势,私人影院在各地蓬勃发展。然而,记者调查发现,生机盎...
日期:08-15
AI哨所 |马斯克组建AI“军团” 对抗ChatGPT
苹果屏幕发展荣耀magic 2推出时间凤凰网科技讯 北京时间4月15日消息,埃隆马斯克(Elon Musk)寻求加入硅谷在生成式人工智能(AI)系统领域的竞赛,目前正在制定计划成立一家新的AI...
日期:04-15
华策影视:成立AIGC应用研究院 将关注影视行业垂类大模型「华策影视公司介绍」
6月19日 消息:华策影视宣布成立AIGC应用研究院,并设立AIGC专项基金,全面推进AIGC产业布局,加快新技术在行业应用落地。据介绍,该研究院立足于华策影视多年发展积累的数据优势、...
日期:06-19
iPhone 15升级C口别高兴!标准版惨遭阉割「iphone14用c口」
iPhone用上USB-C接口比预想的要早一些,新的爆料称iPhone15将全系升级成USB-C接口,不过你可别高兴得太早,因为标准版的两款机型再次被阉割了。google pixel 6 pro 中文苹果知名...
日期:11-20
嗨学网:培养“大国工匠”是职业教育品牌的使命(发展职业教育培养大国工匠)
  目前,我国经济已由高速增长阶段转向高质量发展阶段,人力资源作为世界上最宝贵的资源,作用日渐凸显,更多领域呼唤德行素质好、技能水平高、业务能力强的实践型综合人才。现...
日期:12-25
主流笔记本配置2022「主流笔记本」
随着电脑技术的不断进步,笔记本电脑已经成为了人们生活和工作中不可或缺的一部分。而随着消费者对笔记本电脑的需求不断提高,电脑也应运而生。在这篇文章中,我们将为大家详细介...
日期:05-30
市场份额不降反升 谷歌Pixel在日本成功
谷歌的Pixel手机在日本智能手机市场占有率正在逐渐增长,从2021年第二季度的2%上升至2023年第二季度的12%。尽管苹果的iPhone仍然占据主导地位,占据超过50%的市场份额,但该数字...
日期:09-30
三星DRAM和NAND工厂断电,分析师:有利于清理库存_dram中存储的数据断电后不会丢失
  2020年1月1日,三星电子公司表示,在发生大约一分钟的断电事故后,其华城芯片工厂的部分芯片生产已经暂停。目前正在检查生产线以备重新启动,并评估造成的损失。   看到这则...
日期:07-11
一天搞定50条视频!AI替你打工的流程有人已经跑出来了
声明:本文来自于微信公众号 量子位(ID:QbitAI),作者:梦晨 金磊 发自 凹非寺,授权转载发布。最近的AI狂欢属于ChatGPT,接下来该轮到AI生成视频了。想做UP主但又不知道怎么剪视频的人,...
日期:04-01
浙江12岁女孩确诊甲状腺癌!知名女主播冯提莫曾患此病 你会摸颈部自检吗
8月28日消息,甲状腺位于脖颈前方正中部位,掌管着甲状腺激素份分泌,是身体代谢活动的调控员,被誉为身体的发动机”。iphone屏幕制造商今日,国内媒体报道称,浙江12岁女孩妍妍一年前...
日期:08-29
雷军称小米14 Pro首发的龙晶玻璃成本非常高:米粉希望普及到小米15上
快科技11月16日消息,小米创办人雷军发微博表示,龙晶玻璃目前成本还非常高,大家希望我们普及到标准版上吗?苹果发布自研芯片向英特尔说再见小米mix4 泄露对此,不少米粉留言表示,希...
日期:11-17
华为p60啥时候出来「华为P60发布时间曝光 影像实力或更强」
中关村在线消息:今日,微博博主曝光了华为P60系列的发布时间为明年第一季度,此前传出出的华为P60渲染图真实性存疑。该渲染图显示,华为P60采用了与P50相同的万象双环设计,正面屏幕...
日期:10-11
郑州小吃店老板:4年创业路有猪八戒网陪伴(郑州小吃加盟)
  “要说对猪八戒网有啥不满呢……嗨!那就是在我们郑州,园区开少了,应该再多一些!”   赵玉印用这种“凡尔赛体”,另类地表达了对猪八戒网的“不满”。   而实际上,...
日期:11-14
阿里本地生活板块被爆大裁员,饿了么到店业务或与高德合并_阿里饿了么待遇怎么样
今日,有阿里巴巴员工在社交媒体透露,“阿里巴巴本地生活板块全国裁员,基本全部裁掉,剩下个别并入高德,P7、P8也不留情面,全部毕业。”因特尔第十一代芯片另有媒体消息,近日,阿里巴巴...
日期:02-22
ubuntu 20.04 lts无法联网_Ubuntu 20.04 LTS进驻Windows子系统:只能用3年
  在很多人的印象中,开源的Linux、闭源的Windows应该是势不两立,其实完全不是这样,微软一直都在鼎力支持开源社区,也非常接纳Linux,Windows 10就加入了全新的Linux子系统(WSL)...
日期:06-21
FTX创始人SBF被巴哈马警方逮捕,或被引渡至美国
  崩溃的加密巨头FTX的创始人SamBankman-Fried(SBF)迎来大麻烦。  12月13日,据外媒消息,巴哈马皇家警察部队逮捕了FTX创始人SamBankman-Fried。  根据一份声明,此次逮捕是...
日期:12-13
华为4k摄像机「华为商城上架4K智能摄像头:不用TF卡就能存储」
快科技8月26日消息,华为智选与海雀科技携手推出华为智选 海雀智能摄像头3 4K版,现已商家华为商城,原价349元,众测价299元。海雀智能摄像头3 4K版拥有800万像素臻4K影院级画质,分...
日期:08-26
荣耀play5t首发价「1099元起!荣耀Play6C 5G今日发布:10.13正式开售」
据消息显示,荣耀今天发布了一款入门机型荣耀Play6C 5G,目前新机已开启预售,将于10月13日正式开售。该机采用6.5英寸+720*1600分辨率+90Hz刷新率的LCD显示屏,并通过了德国莱茵低...
日期:10-22