您的位置:首页 > 互联网

OpenAI 加强安全团队并赋予董事会对高风险人工智能的否决权

发布时间:2023-12-19 17:35:49  来源:互联网     背景:

12 月 19 日消息:OpenAI 正在扩展其内部安全流程,以抵御有害人工智能的威胁。公司新成立的安全咨询小组将位于技术团队之上,向领导层提出建议,董事会也被授予否决权——当然,他们是否会实际使用这一权力则是另一个问题。

通常,这类政策的细节不需要报道,因为实际上它们往往涉及许多与外界鲜为人知的闭门会议、职责流程和功能。尽管这种情况可能也适用于此次事件,但近期的领导层动荡和不断演变的 AI 风险讨论,促使人们关注这家全球领先的 AI 开发公司是如何处理安全问题的。

mcn传媒是什么意思

在一份新文件和博客文章中,OpenAI 讨论了他们更新的预备框架,这可能在去年 11 月的重组后进行了一些调整,该重组去除了董事会中两名最减速主义的成员:仍在公司担任略有变化角色的 Ilya Sutskever 和完全离职的 Helen Toner。

更新的主要目的似乎是展示识别、分析和决定如何处理他们正在开发的模型固有的灾难性风险的明确路径。正如他们定义的那样:

备用机买iphone7还是8

我们所说的灾难性风险是指可能导致数千亿美元经济损失或导致许多人严重受伤或死亡的任何风险——这包括但不限于存在风险。

(存在风险是指机器崛起类型的事情。)

投入生产的模型由安全系统团队管理;例如,通过 API 限制或调整来缓解对 ChatGPT 的系统性滥用。正在开发的前沿模型由预备团队负责,这个团队试图在模型发布之前识别和量化风险。然后是超级对齐团队,他们正在为超级智能模型制定理论指导原则,我们可能距离这一点还很遥远。

前两类是真实的而非虚构的,具有相对容易理解的标准。他们的团队将每个模型在四个风险类别上进行评级:网络安全、说服力(例如,虚假信息)、模型自主性(即自主行动)和 CBRN(化学、生物、放射性和核威胁;例如,创造新型病原体的能力)。

假设采取了各种缓解措施:例如,合理地拒绝描述制造凝固汽油弹或管状炸弹的过程。在考虑到已知的缓解措施后,如果模型仍然被评估为具有高风险,它不能被部署,如果模型具有任何关键风险,将不会进一步开发。

OpenAI 的框架中实际记录了这些风险等级,以防您想知道它们是否留给某些工程师或产品经理自行决定。

例如,在网络安全部分中,最实用的部分,通过一定因素提高操作员在关键网络操作任务上的生产力被评为中等风险。另一方面,高风险模型将识别和开发针对强化目标的高价值漏洞的概念验证,而无需人为干预。关键是模型可以在仅给出高级别目标的情况下,为针对强化目标的网络攻击设计和执行端到端的新策略。显然我们不希望这种情况发生(尽管它可以卖出很高的价格)。

oppowatch2智能手表

因此,只有中等和高风险是可以以某种方式容忍的。但制作这些模型的人并不一定是评估它们并提出建议的最佳人选。出于这个原因,OpenAI 正在组建一个跨职能安全咨询小组,该小组将位于技术层面之上,审查专家们的报告并提出更高视野的建议。他们希望这将揭示一些未知的未知,尽管这些未知本质上很难捕捉到。

这一流程要求这些建议同时发送给董事会和领导层,我们理解这是指首席执行官 Sam Altman 和首席技术官 Mira Murati 及其副手。领导层将决定是发布还是搁置,但董事会将能够推翻这些决定。

这将有望阻断之前传闻中发生的类似事件,即高风险产品或流程在董事会未知或未批准的情况下获得批准。该事件的结果是边缘化了两位更具批判性的声音,并任命了一些以金钱为导向的人(Bret Taylor 和 Larry Summers),他们虽然敏锐但并非 AI 专家。

如果一个专家小组提出建议,而首席执行官根据这些信息做出决定,这个友好的董事会真的会觉得有权力反驳他们并踩刹车吗?如果他们这样做,我们会听到吗?除了 OpenAI 将征求独立第三方审计的承诺之外,透明度并没有真正得到解决。

假设开发了一个被评为关键风险类别的模型。过去,OpenAI 并不羞于对此类事情吹嘘——谈论他们的模型是多么强大,以至于他们拒绝发布它们,这是很好的广告。但如果风险如此真实且 OpenAI 如此担心,我们是否能保证这种情况会发生呢?也许这是一个坏主意。但无论如何,它都没有被真正提及。

阅读 OpenAI 完整的准备框架(测试版):

https://cdn.openai.com/openai-preparedness-framework-beta.pdf


返回网站首页

本文评论
微信 Windows PC 3.8.0版发布 支持图片文字提取「电脑版微信图片怎么提取文字」
11月3日 消息:近日,微信PC版向用户推送了3.8.0版本更新,在该版本中,新增了图片文章提取和翻译功能。此外,群主或群管理员可以将群里的消息置顶,邀请朋友进群时可以分享群里的聊天...
日期:11-12
快手电商宣布上线客服举报功能2.0「快手电商的投诉电话」
10月31日 消息:近日,快手电商宣布平台上线了客服举报功能,虽然举报成功后违规账号将被禁言72小时,但禁言失效后,仍受到持续骚扰,现结合商家的诉求,对举报功能做了2.0的升级。小米c...
日期:11-01
打脸!超标2万倍!_超标多少
“福岛核污水即使处理后,污染数值仍超标2万倍”“福岛核电站的多核素处理系统已发生多达8次故障”……6月15日和16日两天,针对日本打算近日正式开始排放福岛核污水入海一事,韩...
日期:06-18
免填邀请码:高效提高App推广效率(app免填邀请码技术原理)
  App 邀请机制是每个产品几乎必做的功能点,它一般以两种形式存在:一是作为常置功能用于推荐,二是作为裂变活动用于邀请。   无论以哪种形式出现,都可以归为社交分享的一种...
日期:10-05
投行预计苹果第二财季营收能达到预期 但同比环比均将下滑_苹果第二季度营收
4月25日消息,据外媒报道,苹果公司已经宣布,他们截至3月底的2023财年第二财季的财报,将在当地时间5月4日发布,财报分析师电话会议,将在太平洋夏令时间5月4日下午2:00,也就是北京时间...
日期:04-25
adobe反P图软件「正面挑战“”Adobe:微软推出免费P图软件Designer」
如果提到在图形图像设计领域有什么无法绕过的公司的话,Adobe绝对榜上有名,该公司凭借PhotoShop等知名图像处理软件,在行业内可谓是风头无两。Adobe全家桶但近日,微软宣布将推出...
日期:10-16
马斯克推特最新新闻「马斯克现在每天工作17小时!收购推特赔了2.9万亿」
中关村在线消息:11月5日,据相关爆料,马斯克自曝现在每天工作17小时。他的工作量从每周大约78小时增加到可能120个小时(平均每天 17小时)”。马斯克表示,“我认为一旦推特走上正轨,...
日期:11-06
梦洁携手宁南县千年蚕丝传承 共同创造7A级有机桑蚕丝
  梦洁作为中国高端床品代表,从诞生之初就致力于为消费者提供更高端的质量和服务。为了寻找更好的制造原材料,梦洁在全球甄选奢品级原材料,精心打造多款产品,精益求精的工匠...
日期:03-20
雀魂 日本「押注“下一款《雀魂》”,日本市场有产品月流水已破400万美元」
声明:本文来自于微信公众号 白鲸出海(ID:baijingapp),作者:尾巴,授权转载发布。2022年,编辑部写过不少游戏,《雀魂》是印象比较深的一个(《日本年轻人线上打麻将,为这款出海产品带来...
日期:01-12
已准备购买土地 亿纬锂能拟在马来西亚建设锂电池工厂_亿纬锂能生产基地
亿纬锂能公告显示,亿纬马来西亚与PEMAJU KELANG LAMA SDN.BHD(PKL)签订谅解备忘录,拟向PKL购买标的土地,在马来西亚建立锂电池制造厂。具体事项将由双方签订的最终买卖协议约定,尚...
日期:09-28
科大讯飞预计2022年度净利润同比下降约70%「科大讯飞历年净利润」
1月29日消息,科大讯飞发布发布2022年度业绩预告。2022年度科大讯飞预计实现营业收入183.14-201.45亿元,较上年同期增长0%-10%;预计实现毛利75.33-82.87亿元,较上年同期增长0%-10...
日期:01-29
一图盘点百度大脑AI开放平台的2020年_百度AI的2020
      开放273项AI能力,汇聚265万开发者   平均每1.2天新增或升级一项能力   十大创新产品,AI技术国际领先   加速AI场景落地,领跑产业智能化   ……   这些成...
日期:07-16
是不是花瓶?Find N2 Flip上手
  自从OPPO Find N2 Flip正式发布之后,绿厂这款竖向折叠屏引起了很多人的关注,毕竟相较于其他竖向折叠屏产品而言,这款手机在价格上要更加的亲民。当然了,价格让人心动也仅仅...
日期:01-03
马斯克推特消息_暗示假账户多?马斯克称与几乎所有推特账户互动减少
8月1日消息,美国当地时间周六,特斯拉首席执行官埃隆·马斯克(Elon Musk)发推文调侃收购推特的交易,他称特斯拉与推特合并后将被称为Twizzler。2020车市火爆在宣布放弃斥资440亿美...
日期:08-23
中国科学院院士李静海: 2022年中国数字经济规模达50.2万亿元,总量稳居世界第二
5月29日消息,近日中关村平行论坛“互联网3.0:未来互联网产业发展论坛”现场,中国科学院院士、北京市科学技术协会主席李静海发表主题演讲。他强调,2022年中国数字经济规模达50.2...
日期:05-30
微软收购ibm「只为一款还未发布的超级大作:微软砸500多亿收购B社」
快科技6月26日讯,独占甚至是限时独占,依然是游戏主机提高销量的主要手段。矿卡为什么不继续挖矿日前在微软和FTC之间的法庭交锋中,Xbox掌门人Phil Spencer坦言,微软收购Zenimax/...
日期:06-27
需求不旺,大众宣布推迟建设第四家电动汽车电池工厂_大众中国电池工厂
小米到底内置esim卡吗11月2日消息,大众集团暂时推迟第四家电动汽车电池工厂的建设计划。CEO奥博穆(Oliver Blume)表示,这是基于欧洲市场状况作出的决定。大众计划在本世纪20年代...
日期:11-02
特斯拉Cybertruck将在今年问世 特斯拉官宣墨西哥超级工厂
3月2日 消息:3月2日,特斯拉举行了投资者大会,展示了Cybertruck卡车的最新进展,预计将于今年上市。自原型车于2019年发布以来,累计订单已达150万台。特斯拉更新了Model Y和Model...
日期:03-02
苹果新品13寸mbp什么时候发布「苹果即将发布2023年的第一款产品?新的MBP和Mac mini」
据爆料者Jon Prosser透露,苹果将于(美国时间)1月17日在其网站上发布2023年的第一款产品。阿里车载智能系统据称,可能发布的产品包括更新后的MacBook Pro和Mac mini机型。更新的1...
日期:01-17
马斯克曝光推特2.0 支持支付、视频等功能_推特马斯克最新消息
11月28日 消息:近日,马斯克在推特上公布了推特2.0。马斯克公布的PPT显示,Twitter将支持长推文、视频、支付、加密私信、蓝标认证优化和广告即服务等功能。从幻灯片来看,在大规...
日期:12-01