您的位置:首页 > 互联网

OpenAI 演示超级智能 AI 的控制方法:研究人员要求 GPT-2 指挥更强大的 GPT-4

发布时间:2023-12-15 14:05:14  来源:互联网     背景:

12 月 15 日消息:OpenAI,一个承诺为全人类利益构建人工智能的公司,自去年推出 ChatGPT 以来,其商业雄心在最近的治理危机中变得更加显著。现在,该公司宣布,一个专注于管理未来超级智能 AI 的新研究小组开始取得成果。

OpenAI 研究员 Leopold Aschenbrenner 表示:通用人工智能(AGI)正在迅速接近。我们将看到超人类模型,它们将具有巨大的能力,可能非常危险,我们还没有控制它们的方法。OpenAI 已承诺将其五分之一的计算能力用于 Superalignment 项目。

OpenAI 今天发布的一份研究报告展示了旨在测试一种让较弱 AI 模型引导更智能 AI 模型行为的实验结果。尽管所涉技术远未超越人类的灵活性,但这个场景被设计为代表将来人类必须与比自己更智能的 AI 系统协同合作的时期。

OpenAI 的研究人员检查了称为监督的过程,该过程用于调整像 GPT-4 这样的大型语言模型,使其更有帮助、减少危害。目前这包括人类对 AI 系统提供哪些答案好,哪些答案差的反馈。随着 AI 的进步,研究人员正在探索如何自动化这个过程,以节省时间,也因为他们认为当 AI 变得更强大时,人类提供有用的反馈可能变得不可能。

在一个使用 OpenAI 2019 年首次发布的 GPT-2 文本生成器教授 GPT-4 的对照实验中,较新系统的能力变得更弱,更类似于较差的系统。研究人员测试了两个解决这个问题的想法。一个是训练逐渐更大的模型来减少每一步的性能损失。在另一个中,团队对 GPT-4 添加了一种算法调整,允许更强大的模型在不太削弱其性能的情况下遵循较弱模型的指导。这种方法更有效,尽管研究人员承认,这些方法并不能保证更强大的模型将表现完美,并将其描述为进一步研究的起点。

oppofindx6 pro会在今年出吗

截图来自 OpenAI

AI 安全中心主任 Dan Hendryks 表示:很高兴看到 OpenAI 积极解决控制超人类 AI 的问题。我们将需要多年的专注努力来应对这一挑战。

Aschenbrenner 和另外两名参与 Superintelligence 团队的成员 Collin Burns 和 Pavel Izmailov 告诉 WIRED,他们对他们所看到的驯服潜在超人类 AI 的重要第一步感到鼓舞。即使六年级学生的数学知识不如大学数学专业的学生,他们仍然可以向大学生传达他们想要实现的目标。Izmailov 说,这就是我们现在试图实现的。

Superalignment 小组由 OpenAI 联合创始人、首席科学家及董事会成员 Ilya Sutskever 共同领导。Sutskever 是今天发布的论文的合著者,但 OpenAI 拒绝让他讨论该项目。

2030年无人驾驶

在 Altman 上个月回归 OpenAI,并达成大部分董事会辞职的协议后,Sutskever 在公司的未来似乎充满不确定性。

Aschenbrenner 说:我们非常感激 Ilya。他一直是项目的巨大动力和激励。

OpenAI 的研究人员并不是第一次尝试使用今天的 AI 技术测试可能帮助驯服未来 AI 系统的技术。像以前在企业和学术实验室中的工作一样,目前无法知道在精心设计的实验中有效的想法是否会在未来实用。研究人员将他们正在尝试完善的让较弱 AI 模型训练更强大模型的能力描述为超级对齐更广泛问题的一个关键组成部分。

所谓的 AI 对齐实验也引发了关于任何控制系统可信度的问题。新 OpenAI 技术的核心依赖于更强大的 AI 系统自己决定可以忽略较弱系统的哪些指导,这可能会导致它忽略未来可能防止其不安全行为的信息。为了使这样的系统有用,需要在对齐方面取得进展。Burns 说:你最终需要非常高度的信任。

加州大学伯克利分校从事 AI 安全工作的教授 Stuart Russell 表示,使用较不强大的 AI 模型控制更强大模型的想法已经存在一段时间了。他还说,目前存在的教导 AI 行为的方法是否是前进的道路尚不清楚,因为它们到目前为止未能使当前模型可靠地行为。

尽管 OpenAI 正在宣传控制更先进 AI 的第一步,但该公司也热衷于征求外部帮助。该公司今天宣布,将与颇具影响力的投资者、谷歌前首席执行官 Eric Schmidt 合作,向外部研究人员提供 1000 万美元的资助,以促进包括弱对强监督、高级模型的可解释性以及加强模型抵御旨在破坏其限制的提示等主题的进一步发展。OpenAI 还将于明年举办一个关于超级对齐的会议,与新论文有关的研究人员说。

Sutskever 是 OpenAI 的联合创始人和 Superalignment 团队的共同领导,他领导了公司许多最重要的技术工作,是越来越多担心如何控制 AI 变得更强大的著名 AI 人物之一。今年,如何控制未来 AI 技术的问题引起了新的关注,这在很大程度上要归功于 ChatGPT。Sutskever 在深度神经网络先驱 Geoffrey Hinton 的指导下攻读了博士学位,后者今年 5 月离开谷歌,目的是警告 AI 现在似乎正在某些任务中迅速接近人类水平。


返回网站首页

本文评论
IE 9 Beta有望近期发布 用户界面基本定型
  据国外媒体报道,有分析人士称,微软很可能于近期发布新一代浏览器IE 9 Beta版。   本周二,微软发布了Windows 7更新KB2120976,微软在对该款更新的描述中称,安装该补丁将使...
日期:07-29
英特尔CEO:加速IDM 2.0转型,推进代工服务发展_intel id
(原标题:英特尔CEO:加速IDM 2.0转型,推进代工服务发展) 10月27日,英特尔公布了公司2023年第三季度的财报,其中,英特尔代工服务收入...
日期:11-16
红米note11pro天玑1200「红米Note 11R上架!天玑芯片配直屏」
中关村在线消息:9月29日,据相关爆料,红米即将明日正式发布红米Note11 R,发售时间为明日上午十点整,售价暂未公布,预计售价不会超过1999元,产品定位为高刷屏长续航,5G小金刚,新机主打...
日期:09-29
压力给到其他公司 字节跳动除夕统一放假:还不占用年假_字节跳动过年怎么放假
快科技10月30日消息,今天,字节跳动除夕放假的消息冲上了微博热搜,根据字节跳动办公软件飞书”日历显示,除夕当天已显示为春节团聚假”。天猫国际进口超市什么时候打折最便宜 ...
日期:10-31
男子试吃花生被制止半夜偷走150斤 网友:想白嫖想疯了吧_吃花生视频
一名男子因多次被炒货店老板制止而在与老板发生冲突后盗走了150余斤花生,引发了广泛的关注和讨论。京东苏泊尔炊具官方旗舰店是真的吗永中office2019专业版办公软件稳了新的i...
日期:04-19
理想L系列车型将迎史上最大更新:全自研大模型Mind GPT上车_理想车型,及车的详细介绍
快科技11月26日消息,我们从理想汽车官方获悉,理想L系列车型将迎来史上最大更新。据悉,理想汽车将在今年年底前将OTA 5.0推送全量用户。此次升级将带来全新的全场景智能驾驶(NOA)...
日期:11-28
盒马X会员店2家新店城市公布 营业面积超过1.6万平方米「盒马x会员新增到哪些城市」
凤凰网科技讯 10月28日消息 盒马X会员店将有两家新店年底陆续开业,分别是上海真如店和上海东虹桥店,盒马官方已经发出招聘信息。两家新店营业面积超过1.6万平方米,其中东虹桥店...
日期:10-29
荣耀畅玩4+128「899元 荣耀畅玩40C上架 千元内没对手」
荣耀最新推出了一款入门级手机——荣耀畅玩40C,首发售价899元。这款新手机搭载了一块6.56英寸屏幕,分辨率为720 x 1612,支持1670万色,并拥有90Hz的刷新率以及269PPI的像素密度。...
日期:07-14
华为汪涛:引领智能时代
通信世界网消息(CWW)8月11日,在2023东湖算力与大数据创新大会上,华为常务董事、ICT基础设施业务管理委员会主任、企业BG总裁汪涛为大会致辞。他表示,华为将持续创新,打造领先的昇...
日期:08-14
ios 17首发提上日程_ios日程提醒有声音提示吗?
ios 17将于6月5日wwdc 2023首发,预计将带来更多重大更新。ios17的一些传闻中的更新和功能包括:马斯克新推特控制中心用户界面变化可定制的应用程序资源库类别苹果音乐锁屏组件...
日期:04-28
婚恋网站被骗可以起诉吗_用户婚恋网站注册信息造假致他人被骗,谁来担责?
  自称是北京大学国际贸易专业硕士,实际上是非知名高校大专学历;说是在某世界500强企业工作,实际上只是一家小企业;说是单身,实际上是离异且有两个孩子……   近日,北...
日期:07-16
百度携手傲游开拓移动领域 加大移动布局
  继前不久傲游发布其首款手机浏览器之后,今日记者获悉,百度与傲游也正式在移动领域达成合作协议,百度移动开放平台将为傲游手机浏览器提供全面的移动转码解决方案,通过双方...
日期:07-25
店门口怒摔iPhone不是剧本!演员刘金要开发布会控告苹果欺诈消费者:我能负责
9月21日消息,苹果直营店门口怒摔iPhone后,演员刘金这两天在网上爆火。随后,刘金在自己的直播间表示,要在北京开新闻发布会,邀请全国各大媒体去参加,同时还喊话优秀的律师团联系他...
日期:09-21
2021中国数字经济新引擎论坛「2023中国数字经济创新发展大会8月在汕头召开」
通信世界网消息(CWW)由工业和信息化部、广东省人民政府联合主办的2023中国数字经济创新发展大会将于8月16日—18日在广东省汕头市举办。数字经济是重组全球要素资源、重塑全球...
日期:07-07
分析师:苹果iPhone 15 Pro和Pro Max价格预计将上涨100美元_苹果15promax参数
9月8日消息,据外媒报道,Wedbush分析师丹·艾夫斯(Dan Ives)表示,iPhone15Pro和iPhone15Pro Max的售价将分别为1099美元和1199美元,比目前的机型高出100美元,基本款iPhone15的价格将...
日期:09-08
周鸿祎这次要大战“红孩儿”_专访周鸿祎
【】很久没见到“红衣大叔”周鸿祎如此激动了。在1个多月间,360集团创始人周鸿祎已经在不同场合、数次谈及生成式人工智能产品GPT4、ChatGPT。在3月29日的“2023数字安全发展...
日期:10-04
国产数据库份额「人大金仓:国产数据库发展的五个一体化」
数据库处于IT应用技术栈的中枢位置,主要承载IT应用系统的数据存储与计算职责。随着互联网、物联网、大数据、人工智能等技术的不断深化发展,IT应用飞速发展,同时也不断对数据库...
日期:11-29
春运期如何自我防护?北医三院ICU专家今日头条、抖音科普直播
  近日,北医三院ICU副主任医师薄世宁在今日头条、西瓜视频、抖音、抖音火山版平台同时直播,向215万网友科普新型冠状病毒相关医学知识,为网友解疑答惑。   冠状病毒在我...
日期:06-09
印度手机产量累计突破20亿部,年增长率达23%
通信世界网消息(CWW)8月16日,据相关媒体报道,随着手机制造的产业生态日渐完备,印度几乎不再需要从中国进口手机整机,而2014年印度每年需要从中国进口1.8亿部手机。Counterpoint印...
日期:08-16
考驾照一定要花钱挨骂吗?00后怒了要整顿驾校:我们要尊重「考驾照需要花钱吗」
谁说去驾校就要挨骂的,你经历过吗?近日,多位在暑假学车的大学生回忆,当想起教练的毒舌”,大多数人心有余悸。一些年轻人发问:考驾照一定要花钱挨骂吗?”智能配送机器人的研究分析以...
日期:08-29